Tilastollinen riippuvuus Flashcards Preview

Tilastotiede > Tilastollinen riippuvuus > Flashcards

Flashcards in Tilastollinen riippuvuus Deck (13):
1

Ristiintaulukointi?

- jos tarkastetavista muuttujista toinen on laatuero- tai luokitteluasteikollinen
- soluihin havainnollisempaa laskea prosentit
- selittävä muuttuja rivimuuttujaksi

2

Kontigenssikerroin?

- C
- luokitteluasteikollisen muuttujien riippuvuuden määrän mittaamiseen
- perustuu 2-ulotteiseen frekvenssijakaumaan, eli ristiintaulukointiin
- saatuja frekvenssejä verrataan odotettuihin frekvensseihin, jossa frekvenssit jakatuneet "todennäköisyyden mukaan" ilman riippuvuutta
---> jos todellisen ja odotettujen frekvenssien välillä ei ole eroa --> ei ole riippuvuutta C = 0
- jos C > 0 --> riippuvuus kasvaa

C < 0,2 --> ei riippuvuutta
C > 0,3 --> riippuvuutta
0,2 < C < 0,3 "ei osaa sanoa" alue

3

Spearmanin järjestykorrellatiokerroin?

- järjestysasteikon muuttujille sopiva riippuvuuden mittari
- jos muuttujien arvojen järjestys on täysin sama r = 1
- täysin päinvastainen järjestys r = -1
- kun satunnainen järjestys toisiinsa nähden r = 0

4

Hajontakaavio?

- jos molemmat muuttujat vähintään välimatkaasteikollisia
- riippuvuus on lineaarista, jos arvot koordinaatistossa keskittyneet suunnilleen, jonkin suoran ympärille
--> nouseva suora = positiivinen riippuvuus
--> laskeva suora = negatiivinen riippuvuus
- jos havaintopisteitä vastaa käyrä, riippuvuus on käyräviivaista
- riippuvuuden voimakkuutta mitataan korrellatiokertoimella

5

Pearsonin korrellaatiokerroin?

- r ja perusjoukosta "p"
- pearsonin tulomomenttikorrellaatiokerroin
- molemmat muuttujat vähintään välimatka-asteikollisia

- mittaa vain lineaarista riippuvuuta
- -1 ei merkitse välttämättä riippumattomuutta, vaan riippuvuus voi olla ei-lineaarista
- havaintojen lukumäärä vaikuttaa
- herkkä poikkeaville havainnoille

- riippuvuus voimakasta, jos itseisarvo r > 0,7
- riippuvuus kohtalaista, jos itseisarvo 0,3 < r < 0.7

6

Selittävä ja selitettätävä muuttuja?

SELITTÄVÄ MUUTTUJA
- syymuuttuja
- merkitään yleensä x:llä

SELITETTÄVÄ MUUTTUJA
- seurausmuuttuja
- merkitään yleensä y:llä

7

Selitysaste?

- korrellatiokertoimen neliö
- ilmoittaa, kuinka suuri osa selitettävän muuttujan vaihtelusta voidaan selittää selittävän muuttujan avulla

8

Regrossio?

- jos välimatka- tai suhdeasteikon muuttujien välillä vallitsee riippuvuussuhde --> voidaan muodostaa matemaattinen malli, joka kuvaa riippujien välistä suhdetta --> mallin avulla voidaan ennustaa toisen muuttujan arvoja
- yhden selittävän muuttujan mallin muodostaminen edellyttää väh. pariakymmentä havaintoparia
- jos selittäviä muuttujia useita, havaintoja tulee olla väh. 50

9

Lineaarinen regressiomalli?

- jos kahden muuttujan välinen riippuvuus on lineaarista --> ensimmäisen asteen yhtälö
- myös nimitystä trendisuora

y = a + bx
--> x selittää y:tä
--> x riippumaton ja y riippuva muuttuja
--> a ja b määritetään pienimmän neliösumman menetelmällä

10

Jäännöstermi?

- residuaali "e"
- on se osa y:n arvoa, jota yhtälö y = a + bx ei pysty ennustamaan
- malli on sitä parempi, mitä pienempi jäännös on

11

Regressiomallin hyvyys?

- miten luotettavina mallin avulla ennusteita voidaan pitää
- ilmoitetaan selityskertoimen avulla

12

Usean selittävän muuttujan regressiomalli?

- regressiomalliin voidaan lisätä useita selittäviä muuttujia
- selittävien muuttujien tulisi olla keskenään riippumattomia
- kuvaaja on kolmiulotteisen avaruuden pinta

13

Dummy-muuttuja?

- regressiomalliin voidaan sisällyttää luokittelu- tai järjestysasteikollinen muuttuja
- voi saada kaksi eri arvoa: 0 tai 1