Uge 10 - Using Statistics to Test Hypothesis/Significance: part 2 Flashcards
(35 cards)
Hvad er nulhypotesen?
Dét, vi faktisk tester. Vi antager, at der ikke er nogen effekt og forsøger så at finde ud af, om det måske ikke passer alligevel.
Hvilke to alternativhypoteser er der?
Retningsbestemt: der er en forskel, og vi ved, hvilken retning den går i.
Ikke-retningsbestemt: der er en forskel, vi ved bare ikke hvilken vej.
Hvad er inferentiel statistik?
Inferentiel statistik er den del af statistikken, hvor vi bruger data fra en sample til at sige noget om hele populationen.
Når vi har vores sample, beregner vi forskellige teststatistikker, men hvad er teststatistikker?
Teststatistikker er tal, vi beregner ud fra en stikprøve, som bruges til at teste en hypotese.
De hjælper os med at afgøre, om noget vi ser i dataene er tilfældigt, eller sandsynligvis også gælder for hele populationen.
Hvad bruger vi en signifikanstest til?
Til at finde ud af, om vores teststatistik er så usædvanlig, at vi kan afvise nulhypotesen (H₀).
Hvad bruges statistiske fordelinger (eng: distributions) som z-distribution og t-distribution til?
Vi bruger statistiske fordelinger som z-fordeling og t-fordeling til at beskrive, hvordan data typisk ville se ud, hvis nulhypotesen er sand. Det giver os grundlaget for at vurdere, hvor usædvanligt vores resultat er.
Hvad er kritiske værdier?
Grænseværdier. Hvis vores resultat lander udenfor denne grænse, er det for vildt til at være tilfældigt.
Hvad er afvisningsområder?
Afvisningsområder: Ofte kaldet haler/outer tails. Her er resultaterne så ekstreme, at vi afviser nulhypotesen.
Lille p – så må H₀.. hvad?
Stor p – så får H₀.. hvad?
Lille p – så må H₀ gå / If p is low (≤ .05), the null must go!
Stor p – så får H₀ ro / If p is high (> .05), the null applies!
Hvad bruges en signifikanttest til?
Til at tjekke, om der er problemer med dataen, eller om vi roligt kan gå videre.
Signifikanstest = tvivl-tester
Hvilke statistiske test kræver normalfordeling?
- Mean (gennemsnit)
- Standard deviation (SD) → Bruges meningsfuldt kun, hvis data er normalfordelte (ellers bør man bruge fx median og range).
- Pearson’s r
- Lineær regression
- Independent t-test
- Dependent t-test (parret)
- ANOVA (independent eller repeated)
Hvordan tester vi, om vores data er normalfordelt?
Med en normalitetstest som Shapiro-Wilk
Ønsker man en høj eller lav p-værdi i en normalitetstest?
Høj, fordi det betyder, at dine data kan betragtes som normalfordelte.
En normalitetstest giver en p-værdi, og hvis den er stor nok (p ≥ 0,05), støtter det, at dine data er normalfordelte – og du kan gå videre med parametriske tests.
Hvornår kan vi bruge central limit theorem (CLT)?
Når data er normalfordelt eller mindst 30 observationer
Kan man stadig bruge t-test og ANOVA (som ellers kræver normalfordeling), hvis ens data ikke er normalfordelt, men man har over 30 samples?
Ja - når stikprøvestørrelsen bliver stor (typisk 30+ personer), vil middelværdierne i stikprøven danne en normalfordeling - uanset hvordan de rå data ser ud.
Hvilken test kan man bruge til at teste for normalitet, hvis ens sample er lille?
Shapiro-Wilks
- H₀: Data er normalfordelte
- H₁: Data er ikke normalfordelte
- p ≥ 0,05 → Behold H₀ → Data er tilpas normalfordelte
Hvad er konfidensinterval?
Et område, hvor vi tror, at den rigtige gennemsnitsværdi i hele populationen ligger.
Vi beregner det ud fra en sample.
Hvad betyder et 95% konfidensinterval?
Hvis vi gentog forsøget mange gange, ville gennemsnittet i 95 ud af 100 samples lande inden for dette interval.
Hvad skal vi bruge for at kunne beregne konfidensintervallet?
samplens gennemsnit og standard error (et mål for, hvor meget gennemsnittet kan svinge)
Hvad kan man bruge bootstrapping til?
Man kan bruge bootstrapping til at få et sikkert skøn med konfidensinterval. Den laver mange nye samples fra ens sample.
Hvad er Type I-fejl?
Opstår, når vi tror, der er en effekt, men der ikke er (gravid mand)
Hvad er Type II-fejl?
Vi tror, der ikke er nogen effekt, men det er der (højgravid kvinde scorer falsk graviditetstest)
Hvilke fire mulige udfald kan der være, når vi drager konklusioner om nulhypotesen?
- Korrekt afvisning af nulhypotesen (der er en effekt)
- Korrekt undladelse af at afvise nulhypotesen (vi beholder nulhypotesen, for der er ingen effekt)
- Forkert afvisning af nulhypotesen (Falsk positiv, Type I-fejl, p-niveau)
- Forkert undladelse af at afvise nulhypotesen (Falsk negativ, Type II-fejl, β-niveau)
Hvad fortæller p-værdien os?
Hvor sikre vi kan være i vores beslutning ift. at afvise eller ikke afvise nulhypotesen