Strona Głównego Urzędu Statystycznego GUS
- Wyszukanie interesujących danych statystycznych
- Pobranie danych w formacie csv
- Import danych do Google Refine
- Wyczyszczenie danych, usunięcie zbędnych rekordów oraz edycja danych za pomocą Google Refine
- Eksport danych w postaci JSON
{
"Kod" : "1101506000",
"Województwo" : "Łódzkie",
"Region" : "Powiat Łódzki Wschodni",
"2002" : 1647.74,
"2003" : 1762.31,
"2004" : 1791.79,
"2005" : 1836.05,
"2006" : 1939.69,
"2007" : 2126.36,
"2008" : 2303.11,
"2009" : 2447.97,
"2010" : 2554.12,
"2011" : 2677.69
},
{
"Kod" : "1101508000",
"Województwo" : "Łódzkie",
"Region" : "Powiat Pabianicki",
"2002" : 1763.97,
"2003" : 1857.39,
"2004" : 1913.13,
"2005" : 1980.37,
"2006" : 2045.07,
"2007" : 2158.65,
"2008" : 2430.88,
"2009" : 2519.87,
"2010" : 2622.52,
"2011" : 2812.11
}
1.Porównanie średnich dochodów w Gdańsku i Olsztynie (wykres stworzony za pomocą Google Charts)
2.Porównanie dochodów w województwach Pomorskim, Mazowieckim oraz Warmińsko-Mazurskim
3.Wypisanie 3 najdrozszych marek samochodow ( wykorzystana kolekcja car_market)
db.car_market.aggregate(
{$group :{_id : "$make", price : { $sum : "$price"}}},
{$sort: {price: -1}},
{$limit: 3}
)
Wynik:
"result" : [
{
"_id" : "mercedes-benz",
"price" : 1186003
},
{
"_id" : "bmw",
"price" : 797690
},
{
"_id" : "jaguar",
"price" : 723345
}
]
4.Wszystkie duże lotniska z Polski ( wykorzystana kolekcja airports)
db.airports.aggregate(
{$match: {iso_country: "PL", type: "large_airport"}},
{$group: {_id: "$name"}}
)
Wynik:
"result" : [
{
"_id" : "Copernicus Wrocław Airport"
},
{
"_id" : "Poznań-Ł�awica Airport"
},
{
"_id" : "Katowice International Airport"
},
{
"_id" : "Modlin Airport"
},
{
"_id" : "John Paul II International Airport Kraków-Balice Airport"
},
{
"_id" : "Warsaw Chopin Airport"
},
{
"_id" : "Gdańsk Lech Wałęsa Airport"
}
],
"ok" : 1
[Plik csv przed oczyszczeniem] (/data/csv/wynagrodzenia_brutto-dszafranek.csv) Oczyszczony JSON