Big Mac: avoin data (1971-2015)

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

Big Mac: avoin data (1971-2015)

Kimmo Vehkalahti
Administrator
UBS on tänä syksynä avannut kuuluisan Big Mac -datansa (1971-2015):

https://www.ubs.com/microsites/prices-earnings/open-data.html

Olen käyttänyt datan vuosikertoja 2012, 2009 ja 2006 (tutkimus tehdään 3 vuoden välein) monilla nykyisillä kursseillani (Johdatus yhteiskuntatilastotieteeseen, Data-analyysi, Monimuuttujamenetelmät jne.). Muuten en niin hampurilaisten ystävä ole, mutta Big Macin otin opetuksen tueksi jo 14 vuotta sitten silloisella Data-analyysi II -kurssilla (jonka nimeksi 4 vuotta myöhemmin tuli Lineaaristen mallien sovellukset). Heräte tuon datan käyttöön tuli Cookin ja Weisbergin (1999) regressioanalyysikirjasta, jonka olin hankkinut 2001 Stanfordin kampuksen kirjakaupasta, muutama kuukausi ennen kuin aloitin em. "Data II" -kurssin veivaamisen (väiteltyäni ja "perittyäni" kurssin lehtori Juha Puraselta). Kirjassa (ja kurssillani) käytettiin vuoden 1991 dataa, jossa oli tietoja vain 45 kaupungista. Se oli hyvin kiinnostava data, ja siitä tehtiin vuosien aikana suuri määrä erilaisia harjoitustöitä.

Tähän asti olen siirrellyt luvut PDF-raporteista esim. Excelin avulla tai tuonut ne Macrofocus Infoscope -ohjelmasta (2012). Molemmilla tavoilla on vaadittu kaikenlaisia säätövaiheita, jotka tietysti sujuvat Survolla näppärästi, ei siinä mitään. Silti tämän syksyn #tilastomooc-kiireiden keskellä ei houkutellut edes ajatus uusimman (2015) datan jyystämisestä käyttökuntoon. Niinpä ilahduin, kun äsken huomasin (kurssin osan 2 viimeisiä harjoituksia valmistellessani) datojen avautuneen. Datan muoto ei kyllä taas ole (luvalla tai luvatta sanoen) niitä kätevimpiä, joten "jyystäminen" jatkuu... (jossain vaiheessa, ehkä MOOCin osan 3 eli Data-analyysin tullessa ajankohtaiseksi). Samalla työllä saan siitä hyvää rakennusmateriaalia myös MOOCin osiin 4 (Lineaariset mallit) ja 5 (Monimuuttujamenetelmät), joten eiköhän se tule tehtyä. Onneksi voi luottaa siihen, että Survolla saa AINA datan haluamaansa muotoon, oli se alun alkaen ihan missä muodossa tahansa.