Tilastollinen päättely Flashcards
(24 cards)
Yleisimmät menetelmät tulosten luotettavuuden ja riskien selvittämiseen?
- estimointi
- hypoteesien testaus
Estimointi?
- tehdään päätelmiä perusjoukon ominaisuuksista otoksesta saatujen tietojen perusteella
- keskiarvo, keskihajonta jne. ovat perusjoukkoa kuvaavien suureiden parametrien estimaatteja eli arvioita
Luottamusväli?
- määritetään otoksesta laskettujen estimaatien perusteella
- väli, jolla perusjoukon vastaava tunnusluku sijaitsee tietyllä todennäköisyydellä –> usein käytetään 95% luottamustasoa
Mistä tilastollisessa testaamisessa on kyse?
- pyritään selvittämään tiettyjen ennakkokäsitysten paikkanasa pitävyyttä jossakin perusjoukossa
- perusjoukkoa koskevat päätelmät tehdään otoksesta saatavien tulosten perusteella
- tutkittava ovatko otoksen mahdolliset erot tilastollisesti merkitseviä vai voidaanko ne olettaa sattumasta johtuviksi
Hypoteesi?
- ennakko-olettamus ja sille vaihtoehtoinen olettamus
- -> tarkoitus tutkia kumpi hypoteeseista oikea
Nollahypoteesi H0
Vastahypoteesi H1
- H0 tarkoittaa olettamusta, että ryhmien välillä ei ole eroja tai ei esiinny riippuvuutta
- tutkimuksessa pyritään usein osoittamaan H0 vääräksi eli hylkäämään nollahypoteesi
- H0 oletetaan olevan voimassa, ellei tilastollisesti voida muuta osoittaa
Yksisuuntainen ja kaksissuntainen testi?
KAKSISUUNTAINEN TESTI
- vaihtoehtoinen hypoteesi on, että eroja esiintyy
YKSISUUNTAINEN TESTI
- kun tutkija on kiinnostunut vain jompaan kumpaan suuntaan esiintyvästä erosta
Testimuuttuja?
- on suure, jonka arvojen perusteella johtopäätökset hypoteesien voimassaolosta tehdään
- otoksesta laskettua testisuureen arvoa verrataan vastaavaan teoreettiseen todennäköisyysjakaumaan –> laskettu arvo on hyvin epätodennäköinen, jos asettuu jakauman äärialueelle –> nollahypoteesi hylätään
Vapausaste?
- kuvaavat “vapaiden muuttujien” lukumäärää
Riskitaso?
- eli merkitsevyystao, jota nimitetään myös p-arvoksi
- p-arvo on hylkäämisvirheen todennäköisyys, jonka perusteella tehdään hypoteeseja koskevat johtopäätökset
Päätöksentekoon liittyvät kaksi virhemahdollisuutta?
- Hylkäämisvirhe
- hylätään H0, vaikka se on tosi - Hyväksymisvirhe
- hyväksytään H0, vaikka se on epätosi
- hylkäämisvirhe vakavampaa kuin hyväksymisvirhe
- laskettu p-arvo ilmoittaa kuinka suuri riski on hylätä oikea nollahypoteesi
p-arvo?
- kun testissä saadaan pieni p-arvo –> H0 voidaan hylätä, koska virhepäätelmän mahdollisuus on pieni
- tutkijan harkinnan mukaan, millä p-arvolla nollahypoteesi hylätään tai hyväksytään
p < 0,001 tilastollisesti erittäin merkitsevä
0,001
Miten tilastolliset testit jaotellaan?
- Parametrisiin
- jakauman mukaiset
- on oletuksia muuttujien mittaustasosta ja jakaumasta - Ei-parametrisiin
- jakaumasta vapaat
- ei ole yhtä paljon vaatimuksia, mutta toisaalta niiden vaoimakkuus on pienempi kuin parametristen testien
Kolmogorov-Smirnovin testi?
- nollahypoteesi on, että otosjakauma ja normaalijakauma eivät poikkea toisistaan
- testattaessa yhden otoksen muutujan jakaumaa
- Z-testi on kahden riippumattoman otoksen keskiarvotesti, joka vastaa parametristen testien t-testiä
Riippumattomuustestit?
- selvitetään kahden muuttujan keskinäistä riipuvuutta
- selviää ainoastaan riippuvuuden olemassaolo, ei sen laatu
- luokitteluasteikon muuttujille valitaan x^¨2 - testi
- järjestysasteikon muuttujille järjestyskorrellatiokertoimen testaus
- määräällisille pearsonin korrelaatiokertoimen testaus
x^2 - riippumattomuustesti?
- ainakin toinen luokitteluasteikon muuttuja
- muodostetaan 2-ulotteinen frekvenssitaulukko
- tästä taulukosta lasketaan x^2 -testisuureen arvo
H0 = muuttujat ovat riippumattomat H1 = muuttuja ovat riippuvaisia toisistaan
- otos on poimittu satunnaisesti ja riippumattomasti
- korkeintaa 20% odotetuista frekvensseistä saa olla pienempiä kuin 5
- kaikki odotetut frekvenssit suurempia kuin 1
x^2 - yhteensopivuustesti?
- testataan kuinka hyvin havaintoaineistosta saadut frekvenssit noudattavat jotain tunnettua jakaumaa
- esim. onko puolueiden kannatuksessa eroja
- testimenettely on sama kuin x^2 riippumattomuustestissä
H0 = muuttuja noudattaa oletettua jakaumaa H1 = muuttuja ei noudata oletettua jakaumaa
Pearsonin korrellatiokerroin?
- määräällisille muuttujille
- testaaminen perustuu normaalijakaumaa muistuttavan t-jakauman testisuureeseen t ja p-arvoon
H0 = muuttujat ovat riippumattomia H1 = muuttujat ovat riiippuvaisia toisistaan
- muuttujien täytyy noudattaa likimain normaalijakaumaa
Yhden otoksen keskiarvon T-testi?
- tarkoituksena selvittää, poikkeavatko tutkittavan perusjoukon odotusarvo ja joku tietty luku toisistaan
- testaus suoritetaan otoksesta saatuun keskiarvoon perustuen
- esim. laaduntarkkailija vertaa otoksesta saatua keskiarvoa tuotteiden tavoitekeskiarvoon
H0 = perusjoukon keskiarvo on sama kuin otoskeskiarvo
H1 = molemmat ovat erisuuruisia (kaksisuuntainen) H1 = toinen suurempi tai pienempi kuin toinen (yksisuuntainen)
Kahden otoksen keskiarvojen T-testi?
- perusjoukosta saatujen otosten keskiarvojen perusteella testataan, poikkeavatko kahden ryhmän keskiarvot toisistaan
- jos ryhmät riippumattomia, käytettään riippumattomien otosten t-testiä
- riippuvien otoksien kanssa käytetään riippuvien otosten t-testiä
H0 = keskiarvot ovat samat H1 = ovat erisuuruiset (kaksisuuntainen) H1 = toinen suurempi tai pienempi (yksisuuntainen)
- otokset poimittu satunnaisesti ja ovat toisistaan riippumattomia
- muuttujat määrällisiä ja likimain normaalisti jakautuneita molemmissa perusjoukoissa
- testisuure määrätytyy varianssien yhtäsuuruuksien mukaan –> käytännössä kaksisuuntainen testi
Varianssianalyysi?
- pyritään selittämään ryhmien välill esiintyviä eroja tai muuttujien välisiä vaikutussuhteita
- useimmiten vertaillaan määrällisen (selitettävän) muttujien arvoja laadullisen (selitävän) muuttujan luokissafda
- menetelmä on testimenetelmä –> verrataan ryhmien keskiarvoja ja testataan erojen tilastollista merkitsevyyttä
- yksisuuntainen ja monisuuntainen varianssianalyysi
H0 = ryhmät eivät eroa perusjoukosta H1 = vähintään yksi ryhmä eroaa
- otokset poimittava satunnaisesti ja toisistaan riippumattomia
- määrällisiä muuttujia
- osaryhmien varianssit likimain yhtä suuret
- varianssien yhtäsuuruus voidaan testata Levenen testillä
- jos ryhmien välillä on eroja –> käytetään ryhmäkeskiarvojen erojen parittaiseen vertailuun tarkoitettuja testejä
Ei-parametriset testit?
- jakaumasta vapaat testit –> perusjoukon jakaumaa ei tunneta tai testien käytön edellytykset eivät ole voimassa
- menetelmät ovat “heikompia” kuin parametrisilla menetelmillä
- kolmogorov-Smirnov-testi
- Mann-Whitney’n U-testi
- Wilcoxonin Signed Rank -testi
- Kruskal-Wallisin testi
Mann-Whitney’n U-testi
- kahden riippumattoman otoksen testi, joka vastaa lähinnä riippumattomien otosten t-testiä
- perustuu havaintoarvojen järjestyslukuihin
- otokset poimittava satunnaisesti
- muuttujat vähintään järjestysasteikollinen
- perusjoukkojen jakaumat ovat keskenään samanlaisia
Wilcoxonin Signe Rank -testi?
- kahden riippuvan otoksen testi –> vastine riippuvien otosten t-testille
- tutkitaan kahden ryhmän jakaumien samanlaisuutta
- jos kyseessä toistomittaus –> nollahypoteesi on, että muutosta ei ole tapahtunut
- vastahypoteesi –> muutosta on tapahtunut
- jakauman suhteen ei ole vaatimuksia
- mitattava muuttuja väh. järjestysasteikollinen
Kruskal-Wallis?
- kolmen tai useamman riippumattoman otoksen ei-parametrinen testi –> vastaa varianssianalyysia
- kun varianssianalyysin oletukset eivät ole voimassa
- riippumattomat ryhmät
- väh. järjestysasteikolliset muuttujat