Tilastollinen riippuvuus Flashcards
(13 cards)
1
Q
Ristiintaulukointi?
A
- jos tarkastetavista muuttujista toinen on laatuero- tai luokitteluasteikollinen
- soluihin havainnollisempaa laskea prosentit
- selittävä muuttuja rivimuuttujaksi
2
Q
Kontigenssikerroin?
A
- C
- luokitteluasteikollisen muuttujien riippuvuuden määrän mittaamiseen
- perustuu 2-ulotteiseen frekvenssijakaumaan, eli ristiintaulukointiin
- saatuja frekvenssejä verrataan odotettuihin frekvensseihin, jossa frekvenssit jakatuneet “todennäköisyyden mukaan” ilman riippuvuutta
- –> jos todellisen ja odotettujen frekvenssien välillä ei ole eroa –> ei ole riippuvuutta C = 0
- jos C > 0 –> riippuvuus kasvaa
C < 0,2 –> ei riippuvuutta
C > 0,3 –> riippuvuutta
0,2 < C < 0,3 “ei osaa sanoa” alue
3
Q
Spearmanin järjestykorrellatiokerroin?
A
- järjestysasteikon muuttujille sopiva riippuvuuden mittari
- jos muuttujien arvojen järjestys on täysin sama r = 1
- täysin päinvastainen järjestys r = -1
- kun satunnainen järjestys toisiinsa nähden r = 0
4
Q
Hajontakaavio?
A
- jos molemmat muuttujat vähintään välimatkaasteikollisia
- riippuvuus on lineaarista, jos arvot koordinaatistossa keskittyneet suunnilleen, jonkin suoran ympärille
- -> nouseva suora = positiivinen riippuvuus
- -> laskeva suora = negatiivinen riippuvuus
- jos havaintopisteitä vastaa käyrä, riippuvuus on käyräviivaista
- riippuvuuden voimakkuutta mitataan korrellatiokertoimella
5
Q
Pearsonin korrellaatiokerroin?
A
- r ja perusjoukosta “p”
- pearsonin tulomomenttikorrellaatiokerroin
- molemmat muuttujat vähintään välimatka-asteikollisia
- mittaa vain lineaarista riippuvuuta
- -1 ei merkitse välttämättä riippumattomuutta, vaan riippuvuus voi olla ei-lineaarista
- havaintojen lukumäärä vaikuttaa
- herkkä poikkeaville havainnoille
- riippuvuus voimakasta, jos itseisarvo r > 0,7
- riippuvuus kohtalaista, jos itseisarvo 0,3 < r < 0.7
6
Q
Selittävä ja selitettätävä muuttuja?
A
SELITTÄVÄ MUUTTUJA
- syymuuttuja
- merkitään yleensä x:llä
SELITETTÄVÄ MUUTTUJA
- seurausmuuttuja
- merkitään yleensä y:llä
7
Q
Selitysaste?
A
- korrellatiokertoimen neliö
- ilmoittaa, kuinka suuri osa selitettävän muuttujan vaihtelusta voidaan selittää selittävän muuttujan avulla
8
Q
Regrossio?
A
- jos välimatka- tai suhdeasteikon muuttujien välillä vallitsee riippuvuussuhde –> voidaan muodostaa matemaattinen malli, joka kuvaa riippujien välistä suhdetta –> mallin avulla voidaan ennustaa toisen muuttujan arvoja
- yhden selittävän muuttujan mallin muodostaminen edellyttää väh. pariakymmentä havaintoparia
- jos selittäviä muuttujia useita, havaintoja tulee olla väh. 50
9
Q
Lineaarinen regressiomalli?
A
- jos kahden muuttujan välinen riippuvuus on lineaarista –> ensimmäisen asteen yhtälö
- myös nimitystä trendisuora
y = a + bx
- -> x selittää y:tä
- -> x riippumaton ja y riippuva muuttuja
- -> a ja b määritetään pienimmän neliösumman menetelmällä
10
Q
Jäännöstermi?
A
- residuaali “e”
- on se osa y:n arvoa, jota yhtälö y = a + bx ei pysty ennustamaan
- malli on sitä parempi, mitä pienempi jäännös on
11
Q
Regressiomallin hyvyys?
A
- miten luotettavina mallin avulla ennusteita voidaan pitää
- ilmoitetaan selityskertoimen avulla
12
Q
Usean selittävän muuttujan regressiomalli?
A
- regressiomalliin voidaan lisätä useita selittäviä muuttujia
- selittävien muuttujien tulisi olla keskenään riippumattomia
- kuvaaja on kolmiulotteisen avaruuden pinta
13
Q
Dummy-muuttuja?
A
- regressiomalliin voidaan sisällyttää luokittelu- tai järjestysasteikollinen muuttuja
- voi saada kaksi eri arvoa: 0 tai 1