Administrator
|
Olen jo 1970-luvun lopulla tarkastellut laskennallisesti ja graafisesti
sitä, kuinka paljon kahden muuttujan havaintoaineiston korrelaatiokerroin muuttuu, kun saadaan yksi uusi havainto. Tästä kirjoitin vuonna 2005 lyhyen teknisen kuvauksen Influence curves for the correlation coefficient Laadin aiheesta myös vuonna 2011 Survo-demon https://www.survo.fi/demos/index.html#ex62 Nyt olen tehnyt pari uutta demoa, joissa asiaa kuvataan dynaamisemmin. Demossa https://www.survo.fi/demos/index.html#ex133 näytetään, miten influenssikäyrästö muuntuu korrelaatiokertoimen vaihdellessa systemaattisesti arvosta -1 ylöspäin askelin 0.01 . Käyrät määrittelevässä Survon piirroskaaviossa PLOT z(x,y)=abs(r*(1-w)+u*v)/w u=sqrt(n/(n*n-1))*(x-mx)/sx odotusarvot mx=0 my=0 v=sqrt(n/(n*n-1))*(y-my)/sy keskihajonnat sx=1 sy=1 w=sqrt((1+u*u)*(1+v*v)) havaintojen lukumäärä n=30 TYPE=CONTOUR SCREEN=NEG ZSCALING=20,0 X=-10,10,0.02 Y=-10,10,0.02 korrelaatiokerroin r sijaitsee vain yhdessä paikassa kertoimena. Täsmennys ZSCALING=20,0 kertoo, että käyrät piirretään niin, että niiden väli vastaa muutosta 1/20=0.05 korrelaatiokertoimessa joko alas- tai ylöspäin. Kuvan keskeltä avautuva vaalea alue kertoo tilanteesta, jossa uusi havainto pitää korrelaatiokertoimen arvon entisellään. Syntyi ajatus, mitä tapahtuu tälle käyrästölle, jos sallitaan korrelaatiokertoimen r poiketa luonnollisista arvoistaan, jotka ovat välillä -1<=r<=1. Itse asiassa em. demossa https://www.survo.fi/demos/index.html#ex133 annetaan sen kasvaa välein 0.01 yli yhden aina arvoon 2 asti. Tällä "kielletyllä" välillä kuva on punasävyinen. Siellä tasa-arvokäyrät muuntuvat hyperbelinluontoisista ellipsimäisiksi ja ne litistyvät keskeltä. On helppo aavistaa, että kuvat tulevat yhä monimuotoisemmiksi kun annetaan parametrin r mennä vielä poikeavammaksi. Tätä osoittaa YouTube-demoni Influence curves for 'correlation coefficients' above 1 jossa r kasvaa arvosta 70 arvoon 83 sadasosa-askelin, jolloin saadaan aikaan jatkuvaa muuntumista kuvaava video. Ehkä mielenkiintoisinta on tarkastella, mitä tapahtuu kuvan keskustan ympärillä. Siellä alussa keskellä oleva 4x4-'pisteistö' kasvaa kahdessa vaiheessa 5x5-'pisteistöksi'. Tämä kaikki on pelkkää fantasiaa, vaikka lähtökohtana ovat selvästi tulkittavat tilastolliset piirrokset. Taru on tässä totuutta ihmeellisempi. Kaikki edellä kuvatut jutut on tehty Survon keinoin. Kuvasarjat on luotu demon https://www.survo.fi/demos/index.html#ex133 kommenteissa esiintyvässä Survon toimituskentässä. Kuvasarjat on muunnettu videotiedostoiksi VirtualDub-ohjelmalla. Olen viime aikoina tehnyt muitakin dynaamisia piirroksia, joista tässä mainittakoon vuoden 1992 Survon englannikielisen käyttöoppaan kansikuvan innoittama Dynamic variation of Survo cover in green Seppo Mustonen |
Administrator
|
Wau! Tuo on todellinen "demoni"! Rajojen ylittäminen on välillä tarpeen, jotta voi nähdä syvemmälle.
Juuri äsken, viimeisenä asiana Kuala Lumpurissa (62nd ISI) ennen lentokentälle lähtöä (kirjoitan tätä kännykällä express-junassa) kerroin Survosta amerikkalaiselle proffalle, johon täällä tutustuin. Näytin paria Highlights-demoa hänen hotellihuoneessaan käytyämme lounaalla, valitettavasti vain kännykän ruudulta. Palaamme asiaan paremmin, nyt aika loppui kesken, kun minun pitää ehtiä Singaporesta lähtevälle Finnairin lennolle kotiin. Hän tuntuu tuntevan kaikki alamme ihmiset, oli hieno tutustua! Hänen keynotensa ja minun viime viikon Data Science -esitykseni resonoivat mukavasti, ja siitä se lähti. Terveisin Kimmo https://communications.williams.edu/news-releases/de-veaux-named-2008-mosteller-statistician-of-the-year/ |
Free forum by Nabble | Edit this page |