Tilastollinen päättely Flashcards Preview

Tilastotiede > Tilastollinen päättely > Flashcards

Flashcards in Tilastollinen päättely Deck (24):
1

Yleisimmät menetelmät tulosten luotettavuuden ja riskien selvittämiseen?

- estimointi
- hypoteesien testaus

2

Estimointi?

- tehdään päätelmiä perusjoukon ominaisuuksista otoksesta saatujen tietojen perusteella
- keskiarvo, keskihajonta jne. ovat perusjoukkoa kuvaavien suureiden parametrien estimaatteja eli arvioita

3

Luottamusväli?

- määritetään otoksesta laskettujen estimaatien perusteella
- väli, jolla perusjoukon vastaava tunnusluku sijaitsee tietyllä todennäköisyydellä --> usein käytetään 95% luottamustasoa

4

Mistä tilastollisessa testaamisessa on kyse?

- pyritään selvittämään tiettyjen ennakkokäsitysten paikkanasa pitävyyttä jossakin perusjoukossa
- perusjoukkoa koskevat päätelmät tehdään otoksesta saatavien tulosten perusteella
- tutkittava ovatko otoksen mahdolliset erot tilastollisesti merkitseviä vai voidaanko ne olettaa sattumasta johtuviksi

5

Hypoteesi?

- ennakko-olettamus ja sille vaihtoehtoinen olettamus
--> tarkoitus tutkia kumpi hypoteeseista oikea

Nollahypoteesi H0
Vastahypoteesi H1

- H0 tarkoittaa olettamusta, että ryhmien välillä ei ole eroja tai ei esiinny riippuvuutta
- tutkimuksessa pyritään usein osoittamaan H0 vääräksi eli hylkäämään nollahypoteesi
- H0 oletetaan olevan voimassa, ellei tilastollisesti voida muuta osoittaa

6

Yksisuuntainen ja kaksissuntainen testi?

KAKSISUUNTAINEN TESTI
- vaihtoehtoinen hypoteesi on, että eroja esiintyy

YKSISUUNTAINEN TESTI
- kun tutkija on kiinnostunut vain jompaan kumpaan suuntaan esiintyvästä erosta

7

Testimuuttuja?

- on suure, jonka arvojen perusteella johtopäätökset hypoteesien voimassaolosta tehdään
- otoksesta laskettua testisuureen arvoa verrataan vastaavaan teoreettiseen todennäköisyysjakaumaan --> laskettu arvo on hyvin epätodennäköinen, jos asettuu jakauman äärialueelle --> nollahypoteesi hylätään

8

Vapausaste?

- kuvaavat "vapaiden muuttujien" lukumäärää

9

Riskitaso?

- eli merkitsevyystao, jota nimitetään myös p-arvoksi
- p-arvo on hylkäämisvirheen todennäköisyys, jonka perusteella tehdään hypoteeseja koskevat johtopäätökset

10

Päätöksentekoon liittyvät kaksi virhemahdollisuutta?

1. Hylkäämisvirhe
- hylätään H0, vaikka se on tosi

2. Hyväksymisvirhe
- hyväksytään H0, vaikka se on epätosi

- hylkäämisvirhe vakavampaa kuin hyväksymisvirhe
- laskettu p-arvo ilmoittaa kuinka suuri riski on hylätä oikea nollahypoteesi

11

p-arvo?

- kun testissä saadaan pieni p-arvo --> H0 voidaan hylätä, koska virhepäätelmän mahdollisuus on pieni
- tutkijan harkinnan mukaan, millä p-arvolla nollahypoteesi hylätään tai hyväksytään

p < 0,001 tilastollisesti erittäin merkitsevä
0,001

12

Miten tilastolliset testit jaotellaan?

1. Parametrisiin
- jakauman mukaiset
- on oletuksia muuttujien mittaustasosta ja jakaumasta

2. Ei-parametrisiin
- jakaumasta vapaat
- ei ole yhtä paljon vaatimuksia, mutta toisaalta niiden vaoimakkuus on pienempi kuin parametristen testien

13

Kolmogorov-Smirnovin testi?

- nollahypoteesi on, että otosjakauma ja normaalijakauma eivät poikkea toisistaan
- testattaessa yhden otoksen muutujan jakaumaa
- Z-testi on kahden riippumattoman otoksen keskiarvotesti, joka vastaa parametristen testien t-testiä

14

Riippumattomuustestit?

- selvitetään kahden muuttujan keskinäistä riipuvuutta
- selviää ainoastaan riippuvuuden olemassaolo, ei sen laatu
- luokitteluasteikon muuttujille valitaan x^¨2 - testi
- järjestysasteikon muuttujille järjestyskorrellatiokertoimen testaus
- määräällisille pearsonin korrelaatiokertoimen testaus

15

x^2 - riippumattomuustesti?

- ainakin toinen luokitteluasteikon muuttuja
- muodostetaan 2-ulotteinen frekvenssitaulukko
- tästä taulukosta lasketaan x^2 -testisuureen arvo

H0 = muuttujat ovat riippumattomat
H1 = muuttuja ovat riippuvaisia toisistaan

- otos on poimittu satunnaisesti ja riippumattomasti
- korkeintaa 20% odotetuista frekvensseistä saa olla pienempiä kuin 5
- kaikki odotetut frekvenssit suurempia kuin 1

16

x^2 - yhteensopivuustesti?

- testataan kuinka hyvin havaintoaineistosta saadut frekvenssit noudattavat jotain tunnettua jakaumaa
- esim. onko puolueiden kannatuksessa eroja
- testimenettely on sama kuin x^2 riippumattomuustestissä

H0 = muuttuja noudattaa oletettua jakaumaa
H1 = muuttuja ei noudata oletettua jakaumaa

17

Pearsonin korrellatiokerroin?

- määräällisille muuttujille
- testaaminen perustuu normaalijakaumaa muistuttavan t-jakauman testisuureeseen t ja p-arvoon

H0 = muuttujat ovat riippumattomia
H1 = muuttujat ovat riiippuvaisia toisistaan

- muuttujien täytyy noudattaa likimain normaalijakaumaa

18

Yhden otoksen keskiarvon T-testi?

- tarkoituksena selvittää, poikkeavatko tutkittavan perusjoukon odotusarvo ja joku tietty luku toisistaan
- testaus suoritetaan otoksesta saatuun keskiarvoon perustuen
- esim. laaduntarkkailija vertaa otoksesta saatua keskiarvoa tuotteiden tavoitekeskiarvoon

H0 = perusjoukon keskiarvo on sama kuin otoskeskiarvo

H1 = molemmat ovat erisuuruisia (kaksisuuntainen)
H1 = toinen suurempi tai pienempi kuin toinen (yksisuuntainen)

19

Kahden otoksen keskiarvojen T-testi?

- perusjoukosta saatujen otosten keskiarvojen perusteella testataan, poikkeavatko kahden ryhmän keskiarvot toisistaan
- jos ryhmät riippumattomia, käytettään riippumattomien otosten t-testiä
- riippuvien otoksien kanssa käytetään riippuvien otosten t-testiä

H0 = keskiarvot ovat samat
H1 = ovat erisuuruiset (kaksisuuntainen)
H1 = toinen suurempi tai pienempi (yksisuuntainen)

- otokset poimittu satunnaisesti ja ovat toisistaan riippumattomia
- muuttujat määrällisiä ja likimain normaalisti jakautuneita molemmissa perusjoukoissa

- testisuure määrätytyy varianssien yhtäsuuruuksien mukaan --> käytännössä kaksisuuntainen testi

20

Varianssianalyysi?

- pyritään selittämään ryhmien välill esiintyviä eroja tai muuttujien välisiä vaikutussuhteita
- useimmiten vertaillaan määrällisen (selitettävän) muttujien arvoja laadullisen (selitävän) muuttujan luokissafda
- menetelmä on testimenetelmä --> verrataan ryhmien keskiarvoja ja testataan erojen tilastollista merkitsevyyttä
- yksisuuntainen ja monisuuntainen varianssianalyysi

H0 = ryhmät eivät eroa perusjoukosta
H1 = vähintään yksi ryhmä eroaa

- otokset poimittava satunnaisesti ja toisistaan riippumattomia
- määrällisiä muuttujia
- osaryhmien varianssit likimain yhtä suuret

- varianssien yhtäsuuruus voidaan testata Levenen testillä
- jos ryhmien välillä on eroja --> käytetään ryhmäkeskiarvojen erojen parittaiseen vertailuun tarkoitettuja testejä

21

Ei-parametriset testit?

- jakaumasta vapaat testit --> perusjoukon jakaumaa ei tunneta tai testien käytön edellytykset eivät ole voimassa
- menetelmät ovat "heikompia" kuin parametrisilla menetelmillä

- kolmogorov-Smirnov-testi
- Mann-Whitney'n U-testi
- Wilcoxonin Signed Rank -testi
- Kruskal-Wallisin testi

22

Mann-Whitney'n U-testi

- kahden riippumattoman otoksen testi, joka vastaa lähinnä riippumattomien otosten t-testiä
- perustuu havaintoarvojen järjestyslukuihin
- otokset poimittava satunnaisesti
- muuttujat vähintään järjestysasteikollinen
- perusjoukkojen jakaumat ovat keskenään samanlaisia

23

Wilcoxonin Signe Rank -testi?

- kahden riippuvan otoksen testi --> vastine riippuvien otosten t-testille
- tutkitaan kahden ryhmän jakaumien samanlaisuutta
- jos kyseessä toistomittaus --> nollahypoteesi on, että muutosta ei ole tapahtunut
- vastahypoteesi --> muutosta on tapahtunut
- jakauman suhteen ei ole vaatimuksia
- mitattava muuttuja väh. järjestysasteikollinen

24

Kruskal-Wallis?

- kolmen tai useamman riippumattoman otoksen ei-parametrinen testi --> vastaa varianssianalyysia
- kun varianssianalyysin oletukset eivät ole voimassa
- riippumattomat ryhmät
- väh. järjestysasteikolliset muuttujat