Uge 10 - Using Statistics to Test Hypothesis/Significance: part 2 Flashcards

(35 cards)

1
Q

Hvad er nulhypotesen?

A

Dét, vi faktisk tester. Vi antager, at der ikke er nogen effekt og forsøger så at finde ud af, om det måske ikke passer alligevel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvilke to alternativhypoteser er der?

A

Retningsbestemt: der er en forskel, og vi ved, hvilken retning den går i.

Ikke-retningsbestemt: der er en forskel, vi ved bare ikke hvilken vej.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er inferentiel statistik?

A

Inferentiel statistik er den del af statistikken, hvor vi bruger data fra en sample til at sige noget om hele populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Når vi har vores sample, beregner vi forskellige teststatistikker, men hvad er teststatistikker?

A

Teststatistikker er tal, vi beregner ud fra en stikprøve, som bruges til at teste en hypotese.

De hjælper os med at afgøre, om noget vi ser i dataene er tilfældigt, eller sandsynligvis også gælder for hele populationen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvad bruger vi en signifikanstest til?

A

Til at finde ud af, om vores teststatistik er så usædvanlig, at vi kan afvise nulhypotesen (H₀).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad bruges statistiske fordelinger (eng: distributions) som z-distribution og t-distribution til?

A

Vi bruger statistiske fordelinger som z-fordeling og t-fordeling til at beskrive, hvordan data typisk ville se ud, hvis nulhypotesen er sand. Det giver os grundlaget for at vurdere, hvor usædvanligt vores resultat er.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hvad er kritiske værdier?

A

Grænseværdier. Hvis vores resultat lander udenfor denne grænse, er det for vildt til at være tilfældigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er afvisningsområder?

A

Afvisningsområder: Ofte kaldet haler/outer tails. Her er resultaterne så ekstreme, at vi afviser nulhypotesen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Lille p – så må H₀.. hvad?
Stor p – så får H₀.. hvad?

A

Lille p – så må H₀ gå / If p is low (≤ .05), the null must go!

Stor p – så får H₀ ro / If p is high (> .05), the null applies!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvad bruges en signifikanttest til?

A

Til at tjekke, om der er problemer med dataen, eller om vi roligt kan gå videre.

Signifikanstest = tvivl-tester

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvilke statistiske test kræver normalfordeling?

A
  • Mean (gennemsnit)
  • Standard deviation (SD) → Bruges meningsfuldt kun, hvis data er normalfordelte (ellers bør man bruge fx median og range).
  • Pearson’s r
  • Lineær regression
  • Independent t-test
  • Dependent t-test (parret)
  • ANOVA (independent eller repeated)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvordan tester vi, om vores data er normalfordelt?

A

Med en normalitetstest som Shapiro-Wilk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ønsker man en høj eller lav p-værdi i en normalitetstest?

A

Høj, fordi det betyder, at dine data kan betragtes som normalfordelte.

En normalitetstest giver en p-værdi, og hvis den er stor nok (p ≥ 0,05), støtter det, at dine data er normalfordelte – og du kan gå videre med parametriske tests.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvornår kan vi bruge central limit theorem (CLT)?

A

Når data er normalfordelt eller mindst 30 observationer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Kan man stadig bruge t-test og ANOVA (som ellers kræver normalfordeling), hvis ens data ikke er normalfordelt, men man har over 30 samples?

A

Ja - når stikprøvestørrelsen bliver stor (typisk 30+ personer), vil middelværdierne i stikprøven danne en normalfordeling - uanset hvordan de rå data ser ud.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hvilken test kan man bruge til at teste for normalitet, hvis ens sample er lille?

A

Shapiro-Wilks

  • H₀: Data er normalfordelte
  • H₁: Data er ikke normalfordelte
  • p ≥ 0,05 → Behold H₀ → Data er tilpas normalfordelte
17
Q

Hvad er konfidensinterval?

A

Et område, hvor vi tror, at den rigtige gennemsnitsværdi i hele populationen ligger.

Vi beregner det ud fra en sample.

18
Q

Hvad betyder et 95% konfidensinterval?

A

Hvis vi gentog forsøget mange gange, ville gennemsnittet i 95 ud af 100 samples lande inden for dette interval.

19
Q

Hvad skal vi bruge for at kunne beregne konfidensintervallet?

A

samplens gennemsnit og standard error (et mål for, hvor meget gennemsnittet kan svinge)

20
Q

Hvad kan man bruge bootstrapping til?

A

Man kan bruge bootstrapping til at få et sikkert skøn med konfidensinterval. Den laver mange nye samples fra ens sample.

21
Q

Hvad er Type I-fejl?

A

Opstår, når vi tror, der er en effekt, men der ikke er (gravid mand)

22
Q

Hvad er Type II-fejl?

A

Vi tror, der ikke er nogen effekt, men det er der (højgravid kvinde scorer falsk graviditetstest)

23
Q

Hvilke fire mulige udfald kan der være, når vi drager konklusioner om nulhypotesen?

A
  1. Korrekt afvisning af nulhypotesen (der er en effekt)
  2. Korrekt undladelse af at afvise nulhypotesen (vi beholder nulhypotesen, for der er ingen effekt)
  3. Forkert afvisning af nulhypotesen (Falsk positiv, Type I-fejl, p-niveau)
  4. Forkert undladelse af at afvise nulhypotesen (Falsk negativ, Type II-fejl, β-niveau)
24
Q

Hvad fortæller p-værdien os?

A

Hvor sikre vi kan være i vores beslutning ift. at afvise eller ikke afvise nulhypotesen

25
Er p-værdien sandsynligheden for, at nulhypotesen er sand?
Nej! Den viser, hvor usædvanligt vores resultat er, hvis nulhypotesen er rigtig P-værdien måler altså, hvor mærkeligt noget er, hvis alt skulle være normalt.
26
Har man bevist den alternative hypotese, hvis vi afviser nulhypotesen?
Nej!
27
Hvilke tre faktorer påvirker signifikanstesten?
1. Typen af statistisk test, vi har beregnet (forskellige test har forskellige regler og grænser) 2. Typen af alternativ hypotese (retningsbestemt vs. ikke-retningsbestemt – eller én- vs. tosidet test) 3. Sample size (jo flere personer, jo lettere er det at se, om noget er rigtigt)
28
Hvad er de 6 steps i en signifikanstest?
1. Formulér nulhypotese (ingen effekt) og alternativ hypotese (der er en effekt) 2. Vælg en grænse for p-værdien (typisk 0,05). Grænsen kaldes a-niveau 3. Beregn din teststatistik med formlen effekt/fejl (formlen fortæller, hvor tydelig effekten er i forhold til usikkerheden i data) 4. Find den kritiske værdi for den valgte p-værdi (dette afhænger af, hvilken test man bruger, en- eller tosidet og sample size) 5. Sammenlign (hvis den beregnede teststatistik er lig med eller større end den kritiske værdi, har man et signifikant resultat - dermed ikke en tilfældighed) 6. Tolk resultatet (vurder, om du skal afvise eller bekræfte nulhypotesen)
29
Hvad fortæller effect size noget om?
Hvor stor en effekt der er (altså hvor meget noget faktisk betyder i praksis)
30
Hvorfor er det godt at rapportere effektstørrelsen sammen med p-værdien?
Fordi p bare fortæller, om der er en effekt, men ikke hvor stor den er (derfor godt at rapportere sammen)
31
Hvilke tre forskellige typer beregninger er der af effect size?
1. Pearson’s r: denne viser, hvor stærk sammenhæng der er mellem to ting (fx højde og vægt) 2. Cohen’s d: denne viser, hvor stor forskellen er mellem to grupper (fx mænds og kvinders testscore) 3. Odds ratio: denne bruges til at sammenligne chancer/odds (fx om folk med og uden behandling bliver raske)
32
Hver af de tre effect sizes har forskellige regler, man skal tolke effekten ud fra. Hvad er disse for hhv. Pearson's r, Cohen's d og Odds ration?
🔴 Lille effekt: * Pearson’s r: ≥ 0,1 * Cohen’s d: 0,2 * Odds Ratio (OR): ≥ 1,49 🟠 Moderat effekt: * Pearson’s r: ≥ 0,3 * Cohen’s d: 0,5 * Odds Ratio (OR): ≥ 3,45 🟢 Stor effekt: * Pearson’s r: ≥ 0,5 * Cohen’s d: 0,8 * Odds Ratio (OR): ≥ 9,0
33
Hvad gør man, hvis p-værdien er mindre end signifikansniveauet (a)?
Så afviser man nulhypotesen (H₀)
34
Hvad betyder det, når teststatistikken er større end den kritiske værdi?
Det betyder, at resultatet er signifikant → Vi har fundet noget, der er usandsynligt under H₀ → Vi afviser nulhypotesen.
35
Hvordan hænger formlen effekt/fejl sammen med sandsynligheden for et signifikant resultat?
Jo større effekt og jo mindre fejl, desto større teststatistik → Høj teststatistik = større sandsynlighed for, at resultatet er signifikant.