Skip to content

Latest commit

 

History

History
124 lines (109 loc) · 3.06 KB

dszafranek.md

File metadata and controls

124 lines (109 loc) · 3.06 KB

Przeciętne miesięczne wynagrodzenia brutto lata 2002 - 2011 według powiatów w Polsce

Źródło

Strona Głównego Urzędu Statystycznego GUS

Co zostało zrobione

  • Wyszukanie interesujących danych statystycznych
  • Pobranie danych w formacie csv
  • Import danych do Google Refine
  • Wyczyszczenie danych, usunięcie zbędnych rekordów oraz edycja danych za pomocą Google Refine
  • Eksport danych w postaci JSON

Przykładowe dane (json):

    {
      "Kod" : "1101506000",
      "Województwo" : "Łódzkie",
      "Region" : "Powiat Łódzki Wschodni",
      "2002" : 1647.74,
      "2003" : 1762.31,
      "2004" : 1791.79,
      "2005" : 1836.05,
      "2006" : 1939.69,
      "2007" : 2126.36,
      "2008" : 2303.11,
      "2009" : 2447.97,
      "2010" : 2554.12,
      "2011" : 2677.69
    },
    {
      "Kod" : "1101508000",
      "Województwo" : "Łódzkie",
      "Region" : "Powiat Pabianicki",
      "2002" : 1763.97,
      "2003" : 1857.39,
      "2004" : 1913.13,
      "2005" : 1980.37,
      "2006" : 2045.07,
      "2007" : 2158.65,
      "2008" : 2430.88,
      "2009" : 2519.87,
      "2010" : 2622.52,
      "2011" : 2812.11
    }

Agregacje:

1.Porównanie średnich dochodów w Gdańsku i Olsztynie (wykres stworzony za pomocą Google Charts) Chart1

2.Porównanie dochodów w województwach Pomorskim, Mazowieckim oraz Warmińsko-Mazurskim Chart2

3.Wypisanie 3 najdrozszych marek samochodow ( wykorzystana kolekcja car_market)

	db.car_market.aggregate(
						{$group :{_id : "$make", price : { $sum : "$price"}}},
						{$sort: {price: -1}},
						{$limit: 3}
							)

Wynik:

	"result" : [
				{
					"_id" : "mercedes-benz",
					"price" : 1186003
				},
				{
					"_id" : "bmw",
					"price" : 797690
				},
				{
					"_id" : "jaguar",
					"price" : 723345
				}
			]

4.Wszystkie duże lotniska z Polski ( wykorzystana kolekcja airports)

	db.airports.aggregate(
					{$match: {iso_country: "PL", type: "large_airport"}}, 
					{$group: {_id: "$name"}}
					)

Wynik:

	"result" : [
        {
                "_id" : "Copernicus Wrocław Airport"
        },
        {
                "_id" : "Poznań-Ł�awica Airport"
        },
        {
                "_id" : "Katowice International Airport"
        },
        {
                "_id" : "Modlin Airport"
        },
        {
                "_id" : "John Paul II International Airport Kraków-Balice Airport"
        },
        {
                "_id" : "Warsaw Chopin Airport"
        },
        {
                "_id" : "Gdańsk Lech Wałęsa Airport"
        }
],
"ok" : 1

Odnośniki do plików:

[Plik csv przed oczyszczeniem] (/data/csv/wynagrodzenia_brutto-dszafranek.csv) Oczyszczony JSON