Korrelaatiokertoimen influenssikäyristä

classic Classic list List threaded Threaded
2 messages Options
Reply | Threaded
Open this post in threaded view
|

Korrelaatiokertoimen influenssikäyristä

Seppo Mustonen
Administrator
Olen jo 1970-luvun lopulla tarkastellut laskennallisesti ja graafisesti
sitä, kuinka paljon kahden muuttujan havaintoaineiston
korrelaatiokerroin muuttuu, kun saadaan yksi uusi havainto.

Tästä kirjoitin vuonna 2005 lyhyen teknisen kuvauksen
Influence curves for the correlation coefficient
Laadin aiheesta myös vuonna 2011 Survo-demon
https://www.survo.fi/demos/index.html#ex62

Nyt olen tehnyt pari uutta demoa, joissa asiaa kuvataan dynaamisemmin.
Demossa
https://www.survo.fi/demos/index.html#ex133
näytetään, miten influenssikäyrästö muuntuu korrelaatiokertoimen
vaihdellessa systemaattisesti arvosta -1 ylöspäin askelin 0.01 .

Käyrät määrittelevässä Survon piirroskaaviossa

PLOT z(x,y)=abs(r*(1-w)+u*v)/w
  u=sqrt(n/(n*n-1))*(x-mx)/sx   odotusarvot mx=0 my=0
  v=sqrt(n/(n*n-1))*(y-my)/sy   keskihajonnat sx=1 sy=1
  w=sqrt((1+u*u)*(1+v*v))       havaintojen lukumäärä n=30
TYPE=CONTOUR SCREEN=NEG ZSCALING=20,0
X=-10,10,0.02 Y=-10,10,0.02

korrelaatiokerroin r sijaitsee vain yhdessä paikassa kertoimena.
Täsmennys ZSCALING=20,0 kertoo, että käyrät piirretään niin, että
niiden väli vastaa muutosta 1/20=0.05 korrelaatiokertoimessa joko
alas- tai ylöspäin. Kuvan keskeltä avautuva vaalea alue kertoo
tilanteesta, jossa uusi havainto pitää korrelaatiokertoimen arvon
entisellään.

Syntyi ajatus, mitä tapahtuu tälle käyrästölle, jos sallitaan
korrelaatiokertoimen r poiketa luonnollisista arvoistaan, jotka ovat
välillä -1<=r<=1.
Itse asiassa em. demossa
https://www.survo.fi/demos/index.html#ex133
annetaan sen kasvaa välein 0.01 yli yhden aina arvoon 2 asti.
Tällä "kielletyllä" välillä kuva on punasävyinen.
Siellä tasa-arvokäyrät muuntuvat hyperbelinluontoisista
ellipsimäisiksi ja ne litistyvät keskeltä.

On helppo aavistaa, että kuvat tulevat yhä monimuotoisemmiksi kun
annetaan parametrin r mennä vielä poikeavammaksi.
Tätä osoittaa YouTube-demoni
Influence curves for 'correlation coefficients'  above 1
jossa r kasvaa arvosta 70 arvoon 83 sadasosa-askelin, jolloin saadaan
aikaan jatkuvaa muuntumista kuvaava video.
Ehkä mielenkiintoisinta on tarkastella, mitä tapahtuu kuvan keskustan
ympärillä. Siellä alussa keskellä oleva 4x4-'pisteistö' kasvaa kahdessa
vaiheessa 5x5-'pisteistöksi'.
Tämä kaikki on pelkkää fantasiaa, vaikka lähtökohtana ovat selvästi
tulkittavat tilastolliset piirrokset. Taru on tässä totuutta
ihmeellisempi.

Kaikki edellä kuvatut jutut on tehty Survon keinoin.
Kuvasarjat on luotu demon
https://www.survo.fi/demos/index.html#ex133
kommenteissa esiintyvässä Survon toimituskentässä.
Kuvasarjat on muunnettu videotiedostoiksi VirtualDub-ohjelmalla.

Olen viime aikoina tehnyt muitakin dynaamisia piirroksia, joista
tässä mainittakoon vuoden 1992 Survon englannikielisen käyttöoppaan
kansikuvan innoittama
Dynamic variation of Survo cover in green

Seppo Mustonen
Reply | Threaded
Open this post in threaded view
|

Re: Korrelaatiokertoimen influenssikäyristä

Kimmo Vehkalahti
Administrator
Wau! Tuo on todellinen "demoni"!  Rajojen ylittäminen on välillä tarpeen, jotta voi nähdä syvemmälle.

Juuri äsken, viimeisenä asiana Kuala Lumpurissa (62nd ISI) ennen lentokentälle lähtöä (kirjoitan tätä kännykällä express-junassa) kerroin Survosta amerikkalaiselle proffalle, johon täällä tutustuin. Näytin paria Highlights-demoa hänen hotellihuoneessaan käytyämme lounaalla, valitettavasti vain kännykän ruudulta. Palaamme asiaan paremmin, nyt aika loppui kesken, kun minun pitää ehtiä Singaporesta lähtevälle Finnairin lennolle kotiin.

Hän tuntuu tuntevan kaikki alamme ihmiset, oli hieno tutustua! Hänen keynotensa ja minun viime viikon Data Science -esitykseni resonoivat mukavasti, ja siitä se lähti.

Terveisin Kimmo

https://communications.williams.edu/news-releases/de-veaux-named-2008-mosteller-statistician-of-the-year/