Tekstinkäsittelyn ja taulukkolaskennan yhteispeliä

classic Classic list List threaded Threaded
3 messages Options
Reply | Threaded
Open this post in threaded view
|

Tekstinkäsittelyn ja taulukkolaskennan yhteispeliä

Kimmo Vehkalahti
Administrator
Kuukauden tauon (IASE2021-järjestely ja uuden lukuvuoden alku) jälkeen pääsin takaisin WELLS-tutkimusprojektin äärelle, käsittelemään ja analysoimaan n. 1.2 miljoonan havainnon mittausdataa, joka koskee opiskelijoiden hyvinvointia.

Mittaukset on tehty suomalaisella FirstBeat-teknologialla. Datan muokkaukseen, analysointiin ja visualisointiin olen toistaiseksi käyttänyt toista kotimaista innovaatiota, suomalaista Survo-ohjelmistoa (tarkemmin sanoen sen avoimeen lähdekoodiin pohjaavaa Survo R -toteutusta). Aion tuottaa raakadatasta myös R:lle (ja siten mm. projektin väitöskirjatutkijoiden käyttöön) soveltuvia aineistoja, mutta toistaiseksi olen pitänyt datan omalla työpöydälläni ja pysytellyt itselleni tutuimmissa datan hallinnan perustyökaluissa, joita Survossa ovat mm. FILE SORT ja FILE AGGR, ja joita osaan käyttää lähes silmät ummessa (tärkeää silloin, kun pitää saada [toisinaan väsyneenäkin] aikaan korkealuokkaisia tuloksia NOPEASTI; aikaa kun ei tunnu enää olevan ns. hukattavaksi ollenkaan).

Olen luvannut pitää aiheesta esitelmän CSDS:n avoimessa tutkimusseminaarissa tänä syksynä, joten ei tässä sen enempää substanssista, mutta pari sanaa vielä taustaksi siitä, miten tilastotieteilijä tuli rekrytoiduksi mukaan tähän todella tärkeään ja kiinnostavaan projektiin.

Lupauduin mukaan projektiin 2019 alussa, palattuani kevään 2018 tutkimuskaudeltani (eli valtsikan kaikkien aikojen ensimmäiseltä, vakituisen henkilöstön neljän vuoden välein käytettävissä olevalta sabattivapaalta) ja viimeisteltyäni julkaisukuntoon Brian S. Everittin kanssa kirjoittamamme MABS-kirjan uuden laitoksen. Päätutkijat olivat minulle entuudestaan tuttuja pitkältä ajalta, joten en empinyt heittäytyä heidän hyvään seuraansa.

Saatuamme WELLS-projektin ensimmäisen yhteisen artikkelimme julki keväällä 2021 (uskomattoman pitkien ja monimutkaisten vaiheiden jälkeen) projektin tutkijat pyysivät minua mukaan seuraavaan haasteeseen.

Olin Kolilla etätöissä, kun kävimme tällaisen viestinvaihdon (tiivistän ja anonymisoin):

6.5.2021: (tutkija 1)
Vihdoin viimein onnellisia uutisia - nyt se meidän artikkeli on vihdoin hyväksytty - jeeeee! Iso iso kiitos teille!
Koskas zoomaillaan ja kippistetään ja mietitään uusia kuvioita __

6.5.2021: (Kimmo)
Mahtavaaaaaa!! 🌹🥂

Good job 👍💪🥇

Terkut P-Karjalasta, jossa oon etä-etätyöviikolla. Palataan!

7.5.2021 (tutkija 2)
Hienoa kyllä kun saatiin se ulos!

Tässä voisi samalla Kimmo sinulta kysyä, kun taistellaan tässä tuon First beat hyvinvointidatan kanssa, että sattuisiko sinulla olemaan kiinnostusta tai aikaa tai halua auttaa meitä sen kanssa? Meillä on siis tehty pienelle otokselle hyvinvointimittaukset (koe ja kontrolliryhmältä) kurssin alussa ja lopussa ja nyt meillä on hervoton määrä sekuntidataa 🙂 Päädyttiin jo siihen että katsotaan yhtä tuntia yössä, mutta long datan analyysien tekeminen tuottaa haasteita! 

Eli kysyisinkin että voisimmeko kenties jutella miten me voitaisiin tässä edetä tai jos haluaisit osallistua tähänkin?

Ihanaa etätyöskentelyä sinne Kolille 😍

7.5.2021 (Kimmo)
Ilman muuta First Beat -datan analysointi (ki)innostaa! Siitä saa takuulla näyttäviä graafeja R:llä, ja niiden pohjalta voi edetä erilaisiin analyyseihin, joissa hyödynnetään täysillä sitä dynamiikkaa. "Hervoton määrä" dataa kuulostaa tosi hyvältä! 😁

Pari viikkoa on lyöty aika l/tukkoon, mutta kuun lopulla onnistuisi Zoom-miitti, jossa vois jutella lisää. Mites teillä?

Kilistellään sitten tuolle Current Psychology -läpimurrollemme!!

7.5.2021 (tutkija 1)
Hei!

Ihan MAHTAVAA, että olet innostunut asiasta, näin me kovasti toivottiinkin! 😃 😃

Näin tulin hypänneeksi niin sanotusti liikkuvaan junaan... Harrastin sellaista hyppelyä paljonkin vielä 90-luvulla ja 2000-luvun alussa, tuoreena tohtorina, mutta 2010-luvulta lähtien yhä vähemmän ja harkitummin. Toisinaan tuollainen hyppy voi kuitenkin tehdä erittäin hyvää (kuten tässä on tehnyt).

(jatkuu... 10-kahvi tuli väliin - postaan tämän varmuuden vuoksi, jottei se häviä) :)
Reply | Threaded
Open this post in threaded view
|

Re: Tekstinkäsittelyn ja taulukkolaskennan yhteispeliä

Kimmo Vehkalahti
Administrator
Laitan tässä vaiheessa tämän tarinnan jatkoksi PDF-muotoisen näkymän, jonka tein kuukausi sitten sivutuotteena, luettuani Linda Liukkaan mainion, reikäkortteja koskevan jutun HS:n Visio-liitteestä. Sen jälkeen minun on syvennyttävä varsinaisen tutkimuksen edistämiseen ja palattava siihen tuonnempana.

Rakentelin ja lähetin siis tämän Taulukon-survontaa-KV-20210816.pdf -tiedoston Lindalle näyttääkseni, miten hauskojen tietojenkäsittelyllisten pikku haasteiden parissa juuri tuolloin, hänen juttunsa luettuani, työskentelin.

Survo-käyttäjille tässä ei pitäisi olla mitään kovin ihmeellistä: tässähän on kyseessä yli 40 vuotta eri alustoilla käytettävissä olleiden, Survon toimituskentän "pikku apulaisten" (REPLACE, FORM ym.) soveltaminen sinällään bagatelliin muotoilutehtävään, kiteytettynä Survolle (ja minulle) tyypilliseksi, dokumentoiduksi työkaavioksi.

Mutta ilman tällaisia mahdollisuuksia en tule toimessani toimeen, vaikka nykyään opetan ja käytänkin mielelläni "moderneiksi" kutsuttuja, avoimen tieteen state-of-the-art -tason työkaluja (R, RStudio, R Markdown). Se, mikä niistä kuitenkin edelleen puuttuu, on Survon vahvin puoli, johon olen itsekin tottunut jo yli 30 vuoden ajan: ihmisen ja koneen välisen vapaamuotoisen vuorovaikutteisuuden tuki, jonka tarjoaa (näennäisesti) yksinkertainen toimituskenttä, tuo taulukkolaskennan ja tekstinkäsittelyn saumattomasti yhdistävä "pelikenttä", jonka Seppo Mustonen keksi joululomallaan 1979.
Reply | Threaded
Open this post in threaded view
|

Re: Tekstinkäsittelyn ja taulukkolaskennan yhteispeliä

Kimmo Vehkalahti
Administrator
PS. Elokuun hektisinä hetkinä em. PDF:ään pujahti pari pikku virhettä, jotka kokeneet Survo-käyttäjät bongaavat heti, mutta aloittelijat eivät välttämättä huomaa lainkaan. En viitsinyt niitä nyt alkaa korjata.