Tilastollinen päättely Flashcards

(24 cards)

1
Q

Yleisimmät menetelmät tulosten luotettavuuden ja riskien selvittämiseen?

A
  • estimointi

- hypoteesien testaus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Estimointi?

A
  • tehdään päätelmiä perusjoukon ominaisuuksista otoksesta saatujen tietojen perusteella
  • keskiarvo, keskihajonta jne. ovat perusjoukkoa kuvaavien suureiden parametrien estimaatteja eli arvioita
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Luottamusväli?

A
  • määritetään otoksesta laskettujen estimaatien perusteella
  • väli, jolla perusjoukon vastaava tunnusluku sijaitsee tietyllä todennäköisyydellä –> usein käytetään 95% luottamustasoa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mistä tilastollisessa testaamisessa on kyse?

A
  • pyritään selvittämään tiettyjen ennakkokäsitysten paikkanasa pitävyyttä jossakin perusjoukossa
  • perusjoukkoa koskevat päätelmät tehdään otoksesta saatavien tulosten perusteella
  • tutkittava ovatko otoksen mahdolliset erot tilastollisesti merkitseviä vai voidaanko ne olettaa sattumasta johtuviksi
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hypoteesi?

A
  • ennakko-olettamus ja sille vaihtoehtoinen olettamus
  • -> tarkoitus tutkia kumpi hypoteeseista oikea

Nollahypoteesi H0
Vastahypoteesi H1

  • H0 tarkoittaa olettamusta, että ryhmien välillä ei ole eroja tai ei esiinny riippuvuutta
  • tutkimuksessa pyritään usein osoittamaan H0 vääräksi eli hylkäämään nollahypoteesi
  • H0 oletetaan olevan voimassa, ellei tilastollisesti voida muuta osoittaa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Yksisuuntainen ja kaksissuntainen testi?

A

KAKSISUUNTAINEN TESTI
- vaihtoehtoinen hypoteesi on, että eroja esiintyy

YKSISUUNTAINEN TESTI
- kun tutkija on kiinnostunut vain jompaan kumpaan suuntaan esiintyvästä erosta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Testimuuttuja?

A
  • on suure, jonka arvojen perusteella johtopäätökset hypoteesien voimassaolosta tehdään
  • otoksesta laskettua testisuureen arvoa verrataan vastaavaan teoreettiseen todennäköisyysjakaumaan –> laskettu arvo on hyvin epätodennäköinen, jos asettuu jakauman äärialueelle –> nollahypoteesi hylätään
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vapausaste?

A
  • kuvaavat “vapaiden muuttujien” lukumäärää
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Riskitaso?

A
  • eli merkitsevyystao, jota nimitetään myös p-arvoksi

- p-arvo on hylkäämisvirheen todennäköisyys, jonka perusteella tehdään hypoteeseja koskevat johtopäätökset

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Päätöksentekoon liittyvät kaksi virhemahdollisuutta?

A
  1. Hylkäämisvirhe
    - hylätään H0, vaikka se on tosi
  2. Hyväksymisvirhe
    - hyväksytään H0, vaikka se on epätosi
  • hylkäämisvirhe vakavampaa kuin hyväksymisvirhe
  • laskettu p-arvo ilmoittaa kuinka suuri riski on hylätä oikea nollahypoteesi
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

p-arvo?

A
  • kun testissä saadaan pieni p-arvo –> H0 voidaan hylätä, koska virhepäätelmän mahdollisuus on pieni
  • tutkijan harkinnan mukaan, millä p-arvolla nollahypoteesi hylätään tai hyväksytään

p < 0,001 tilastollisesti erittäin merkitsevä
0,001

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Miten tilastolliset testit jaotellaan?

A
  1. Parametrisiin
    - jakauman mukaiset
    - on oletuksia muuttujien mittaustasosta ja jakaumasta
  2. Ei-parametrisiin
    - jakaumasta vapaat
    - ei ole yhtä paljon vaatimuksia, mutta toisaalta niiden vaoimakkuus on pienempi kuin parametristen testien
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kolmogorov-Smirnovin testi?

A
  • nollahypoteesi on, että otosjakauma ja normaalijakauma eivät poikkea toisistaan
  • testattaessa yhden otoksen muutujan jakaumaa
  • Z-testi on kahden riippumattoman otoksen keskiarvotesti, joka vastaa parametristen testien t-testiä
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Riippumattomuustestit?

A
  • selvitetään kahden muuttujan keskinäistä riipuvuutta
  • selviää ainoastaan riippuvuuden olemassaolo, ei sen laatu
  • luokitteluasteikon muuttujille valitaan x^¨2 - testi
  • järjestysasteikon muuttujille järjestyskorrellatiokertoimen testaus
  • määräällisille pearsonin korrelaatiokertoimen testaus
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

x^2 - riippumattomuustesti?

A
  • ainakin toinen luokitteluasteikon muuttuja
  • muodostetaan 2-ulotteinen frekvenssitaulukko
  • tästä taulukosta lasketaan x^2 -testisuureen arvo
H0 = muuttujat ovat riippumattomat
H1 = muuttuja ovat riippuvaisia toisistaan
  • otos on poimittu satunnaisesti ja riippumattomasti
  • korkeintaa 20% odotetuista frekvensseistä saa olla pienempiä kuin 5
  • kaikki odotetut frekvenssit suurempia kuin 1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

x^2 - yhteensopivuustesti?

A
  • testataan kuinka hyvin havaintoaineistosta saadut frekvenssit noudattavat jotain tunnettua jakaumaa
  • esim. onko puolueiden kannatuksessa eroja
  • testimenettely on sama kuin x^2 riippumattomuustestissä
H0 = muuttuja noudattaa oletettua jakaumaa
H1 = muuttuja ei noudata oletettua jakaumaa
17
Q

Pearsonin korrellatiokerroin?

A
  • määräällisille muuttujille
  • testaaminen perustuu normaalijakaumaa muistuttavan t-jakauman testisuureeseen t ja p-arvoon
H0 = muuttujat ovat riippumattomia
H1 = muuttujat ovat riiippuvaisia toisistaan
  • muuttujien täytyy noudattaa likimain normaalijakaumaa
18
Q

Yhden otoksen keskiarvon T-testi?

A
  • tarkoituksena selvittää, poikkeavatko tutkittavan perusjoukon odotusarvo ja joku tietty luku toisistaan
  • testaus suoritetaan otoksesta saatuun keskiarvoon perustuen
  • esim. laaduntarkkailija vertaa otoksesta saatua keskiarvoa tuotteiden tavoitekeskiarvoon

H0 = perusjoukon keskiarvo on sama kuin otoskeskiarvo

H1 = molemmat ovat erisuuruisia (kaksisuuntainen)
H1 = toinen suurempi tai pienempi kuin toinen (yksisuuntainen)
19
Q

Kahden otoksen keskiarvojen T-testi?

A
  • perusjoukosta saatujen otosten keskiarvojen perusteella testataan, poikkeavatko kahden ryhmän keskiarvot toisistaan
  • jos ryhmät riippumattomia, käytettään riippumattomien otosten t-testiä
  • riippuvien otoksien kanssa käytetään riippuvien otosten t-testiä
H0 = keskiarvot ovat samat
H1 = ovat erisuuruiset (kaksisuuntainen)
H1 = toinen suurempi tai pienempi (yksisuuntainen)
  • otokset poimittu satunnaisesti ja ovat toisistaan riippumattomia
  • muuttujat määrällisiä ja likimain normaalisti jakautuneita molemmissa perusjoukoissa
  • testisuure määrätytyy varianssien yhtäsuuruuksien mukaan –> käytännössä kaksisuuntainen testi
20
Q

Varianssianalyysi?

A
  • pyritään selittämään ryhmien välill esiintyviä eroja tai muuttujien välisiä vaikutussuhteita
  • useimmiten vertaillaan määrällisen (selitettävän) muttujien arvoja laadullisen (selitävän) muuttujan luokissafda
  • menetelmä on testimenetelmä –> verrataan ryhmien keskiarvoja ja testataan erojen tilastollista merkitsevyyttä
  • yksisuuntainen ja monisuuntainen varianssianalyysi
H0 = ryhmät eivät eroa perusjoukosta
H1 = vähintään yksi ryhmä eroaa 
  • otokset poimittava satunnaisesti ja toisistaan riippumattomia
  • määrällisiä muuttujia
  • osaryhmien varianssit likimain yhtä suuret
  • varianssien yhtäsuuruus voidaan testata Levenen testillä
  • jos ryhmien välillä on eroja –> käytetään ryhmäkeskiarvojen erojen parittaiseen vertailuun tarkoitettuja testejä
21
Q

Ei-parametriset testit?

A
  • jakaumasta vapaat testit –> perusjoukon jakaumaa ei tunneta tai testien käytön edellytykset eivät ole voimassa
  • menetelmät ovat “heikompia” kuin parametrisilla menetelmillä
  • kolmogorov-Smirnov-testi
  • Mann-Whitney’n U-testi
  • Wilcoxonin Signed Rank -testi
  • Kruskal-Wallisin testi
22
Q

Mann-Whitney’n U-testi

A
  • kahden riippumattoman otoksen testi, joka vastaa lähinnä riippumattomien otosten t-testiä
  • perustuu havaintoarvojen järjestyslukuihin
  • otokset poimittava satunnaisesti
  • muuttujat vähintään järjestysasteikollinen
  • perusjoukkojen jakaumat ovat keskenään samanlaisia
23
Q

Wilcoxonin Signe Rank -testi?

A
  • kahden riippuvan otoksen testi –> vastine riippuvien otosten t-testille
  • tutkitaan kahden ryhmän jakaumien samanlaisuutta
  • jos kyseessä toistomittaus –> nollahypoteesi on, että muutosta ei ole tapahtunut
  • vastahypoteesi –> muutosta on tapahtunut
  • jakauman suhteen ei ole vaatimuksia
  • mitattava muuttuja väh. järjestysasteikollinen
24
Q

Kruskal-Wallis?

A
  • kolmen tai useamman riippumattoman otoksen ei-parametrinen testi –> vastaa varianssianalyysia
  • kun varianssianalyysin oletukset eivät ole voimassa
  • riippumattomat ryhmät
  • väh. järjestysasteikolliset muuttujat