6. Hypotesprövning - Metod II Flashcards

(51 cards)

1
Q

Vad är hypotesprövning (nollhypotesprövning / NHST)?

A

Hypotesprövning är en steg-för-steg-metod för att analysera ett experiment och se om skillnader i data är statistiskt signifikanta eller bara slump.

Kallas också nollhypotesprövning (null hypothesis significance testing, NHST).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Varför använder vi hypotesprövning?

A

För att vi nästan alltid jobbar med stickprov, inte hela populationen. Vi behöver veta om våra resultat är tillförlitliga.

Det finns variation i data (människor skiljer sig + mätfel)
Om vi gör om samma experiment får vi ofta ett annat medelvärde
Hypotesprövning hjälper oss avgöra om våra resultat är sannolikt äkta eller slump

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad menas med att hypotesprövning är induktiv och indirekt?

A

Induktiv: Vi drar slutsatser från ett begränsat stickprov → om något gäller för hela populationen.
Indirekt: Vi börjar med att anta att det inte finns någon effekt (nollhypotes) och försöker sedan motbevisa det.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är nollhypotesen (H₀)?

A

Nollhypotesen är ett påstående om att det inte finns någon skillnad eller effekt i det du undersöker.

Det är grunden i hypotesprövning – du börjar alltid med att anta att nollhypotesen är sann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad är de tre grundstegen i hypotesprövning (NHST)?

A

Formulera en nollhypotes (H₀):
Anta att det inte finns någon effekt eller skillnad.

Räkna ut sannolikheten att få de observerade resultaten, om nollhypotesen faktiskt är sann.

Jämför sannolikheten med signifikansnivån (ofta 0,05):
Om sannolikheten är lägre än 0,05 → förkasta H₀
Om högre → behåll H₀

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad betyder p < 0,05?

A

Det betyder att sannolikheten att resultatet beror på slumpen är mindre än 5 %.
→ Då tror vi att resultatet är på riktigt, och vi förkastar nollhypotesen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad gör man i steg 1 av hypotesprövning?

A

Man formar två hypoteser:

Nollhypotes (H₀): Det finns ingen effekt eller skillnad.
→ T.ex. medelvärde A = medelvärde B
Alternativhypotes (H₁): Det finns en effekt eller skillnad.
→ T.ex. medelvärde A ≠ medelvärde B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Steg 1 – Vad händer om man kan förkasta nollhypotesen H₀?

A

Då antar man att alternativhypotesen H₁ är sann, alltså att det finns en effekt av den oberoende variabeln.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad gör man i steg 2 av hypotesprövning?

A

Man beräknar sannolikheten (p-värdet) för att observerade skillnader i datan hade kunnat uppstå om H₀ är sann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hur får man fram ett p-värde i steg 2?

A

Man använder ett statistiskt test, t.ex.
t-test
ANOVA
Dessa ger ett p-värde mellan 0–1, som visar hur sannolikt det är att skillnaderna i datan beror på slumpen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är α (alfa)?

A

Det är gränsen vi sätter för hur mycket slump vi accepterar (ofta 0,05 = 5%).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad är p-värde?

A

Det är resultatet från vårt test – sannolikheten att få den data vi fick, om nollhypotesen är sann.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hur använder man p och α tillsammans?

A

Vi jämför dem.
Om p < α → Förkasta H₀ (det är en riktig effekt!)
Om p ≥ α → Behåll H₀ (vi kan inte visa någon effekt).

Om p är mindre än gränsen (a) så förkastar man H0
Men om p är större eller lika med gränsen (a) så behåller man H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vad gör man i steg 3 av hypotesprövning?

A

En signifikansnivå (α) är bestämd, t.ex. 0,05.
Jämför det p-värde du fick i steg 2 mot α:
Om p < α → Förkasta H₀ (det finns troligen en effekt).
Om p ≥ α → Behåll H₀ (du kan inte visa någon effekt).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vad betyder det om vi förkastar H₀ eller inte?

A

Förkastar H₀ → Resultatet är statistiskt signifikant. Vi kan säga att den oberoende variabeln hade en effekt.
Behåller H₀ → Resultatet är inte statistiskt signifikant.
(Men det betyder inte att vi bevisat att ingen effekt finns!)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vad är den förenklade versionen av hypotesprövning?

A

Bestäm nollhypotes H₀: “Ingen skillnad mellan grupperna.”
Få fram p-värde från SPSS eller liknande.
Om p < 0,05 → Förkasta H₀! (“If the p is low, then the H₀ must go!”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Vad betyder det om p-värdet är högt (p > 0,05)?

A

Vi kan inte förkasta nollhypotesen H₀. Det betyder att vi inte har tillräckliga bevis för att säga att det finns en effekt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vad är ett statistiskt signifikant resultat?

A

Det betyder att skillnaden i våra resultat är större än vad som kan förklaras av slumpen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vad är den vanligaste signifikansnivån (α)?

A

α = 0,05 är vanligast. Ibland används även α = 0,01.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Vad säger statistisk signifikans INTE?

A

Den säger inte hur stor effekten är (det gör effektstorlek).

Den säger inget om effekten är praktiskt viktig eller vetenskapligt viktig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vilka två utfall finns i hypotesprövning?

A

Antingen förkastar vi nollhypotesen (H₀)
Eller så misslyckas vi att förkasta nollhypotesen
(OBS: Vi kan aldrig “bekräfta” H₀.)

22
Q

Vad betyder det när vi säger “mycket signifikant”?

A

Det är meningslöst att säga. p-värde mäter bara om vi kan förkasta H₀ eller inte — inte hur mycket.

23
Q

Vad kan ett icke signifikant resultat bero på?

A

För litet stickprov (sample size)
Stor variation i data, t.ex.:
Flertydiga instruktioner
Problem med mätningen

24
Q

Vad visar visualiseringen på slide 13?

A

Slide 13 visar en sampling distribution under nollhypotesen (H₀) – alltså hur värdena skulle fördela sig om H₀ är sann. Vårt observerade värde (330,6) är markerat.

25
Vad betyder α = 0,05 i visualiseringen på slide 14?
Det betyder att vi har satt en gräns för vad vi betraktar som "ovanligt" (kritiska områden i svansarna på 2,5 % på varje sida). Om vårt resultat hamnar i dessa områden förkastar vi H₀.
26
Vad innebär p = 0,03112 i visualiseringen på slide 15?
Det betyder att sannolikheten att få vårt resultat (eller mer extremt) om H₀ är sann är 3,1 %. Eftersom 0,03112 < 0,05 kan vi förkasta H₀.
27
Vad visar visualiseringen på slides 13–15?
Slide 13: Här visas en normalfördelningskurva (= en klockformad kurva) som beskriver hur vårt stickprov borde se ut om nollhypotesen (H₀) är sann. ➔ Alltså: hur mycket variation vi normalt kan förvänta oss bara av slumpen. Slide 14: Vi har bestämt en signifikansnivå α = 0,05, alltså 5 %. ➔ Det betyder att om resultatet hamnar i de yttersta 5 % av fördelningen (2,5 % på varje sida) så förkastar vi H₀. (De rödmarkerade delarna på kurvan visar detta.) Slide 15: Vårt test gav ett p-värde på 0,03112. ➔ Det betyder att det är ungefär 3 % chans att få ett så extremt resultat bara av slumpen om H₀ är sann. Eftersom 0,03112 är mindre än 0,05, så ligger vårt resultat i den röda zonen och vi förkastar H₀.
28
Hur tolkas utfall i hypotesprövning (slide 16)?
Om H₀ är sann och vi förkastar H₀ → Typ I-fel (falskt positivt). Om H₀ är falsk och vi inte förkastar H₀ → Typ II-fel (falskt negativt). Målet är att korrekt förkasta H₀ när den är falsk!
29
Vad kan hända vid hypotesprövning?
Två möjliga utfall: Vi förkastar H₀ Vi förkastar inte H₀ Vi kan bara ta beslut, inte "bevisa" något. P-värdet säger inte hur stark effekten är.
30
Vad är Typ I- och Typ II-fel i hypotesprövning?
Typ I-fel: Vi förkastar H₀ fast den egentligen är sann. (Ex: Dömer en oskyldig) Typ II-fel: Vi förkastar inte H₀ fast den egentligen är falsk. (Ex: Friar en skyldig)
31
Hur kan vi koppla rättssystemet till Typ I och Typ II-fel?
Typ I-fel: Döma en oskyldig för ett brott. Typ II-fel: Missa att döma en som faktiskt är skyldig.
32
Vad är ett Typ I- och Typ II-fel? (med exempel)
Typ I-fel (false positive): Vi säger att något finns fast det inte gör det. → Exempel: Läkare säger att en man är gravid. Typ II-fel (false negative): Vi missar något som faktiskt finns. → Exempel: Läkare säger att en gravid kvinna inte är gravid.
33
Hur kopplas sannolikhet till Typ I- och Typ II-fel?
Typ I-fel sker med sannolikheten α (t.ex. 0,05). Typ II-fel sker med sannolikheten β. Korrekt beslut: H₀ är sann och vi förkastar inte → sannolikhet 1-α. H₀ är falsk och vi förkastar H₀ → sannolikhet 1-β.
34
Vad betyder β och 1-β i hypotesprövning?
β (beta): Sannolikheten att göra ett Typ II-fel. → Vi misslyckas att upptäcka en verklig effekt. (Vi tror att inget händer, fast det gör det.) 1-β: Testets power (styrka). → Sannolikheten att vi korrekt upptäcker en verklig effekt. (Vi förkastar H₀ när vi borde!)
35
Vad händer om vi sänker α (t.ex. från 0,05 till 0,01)?
Mindre risk för Typ I-fel (falskt positivt). Men större risk för Typ II-fel (missa verklig effekt). α = 0,05 är en vanlig kompromiss. Varför? Om du kräver superhög bevisnivå (α = 0,01), så måste datan vara extremt tydlig. Men även om medicinen fungerar lite grann, kanske du inte ser det → du missar effekten → Typ II-fel.
36
Vanligt missförstånd: "Lågt p-värde = stor effekt"?
Missförstånd: Ett lågt p-värde betyder INTE att effekten är stor. Korrekt: Ett lågt p-värde betyder att resultatet är osannolikt om nollhypotesen vore sann (även små effekter kan få lågt p-värde om stickprovet är stort).
37
Vanligt missförstånd: "p-värdet = sannolikheten att H₀ är falsk"?
Missförstånd: p-värdet är INTE sannolikheten att nollhypotesen är falsk. Korrekt: p-värdet är sannolikheten att få ett resultat lika extremt (eller mer extremt) som det observerade, givet att H₀ är sann.
38
Vanligt missförstånd: "Ej signifikant resultat = H₀ är sann"?
Missförstånd: Ett icke-signifikant resultat betyder INTE att nollhypotesen är sann. Korrekt: Det betyder bara att vi inte har tillräcklig bevisning för att säga att H₀ är falsk.
39
Vilka påståenden är rimliga baserat på att p = 0,006 i en studie?
The null hypothesis should be rejected. (Ja, p < 0,05 → vi förkastar H₀.) The research hypothesis has been shown to be true. (Nej, vi kan bara säga att det finns stöd för forskningshypotesen, inte att den är "bevisad sann".) The results are of scientific importance. (Nej, statistisk signifikans säger inget om vetenskaplig betydelse – det beror på effektstorlek.) The probability that the null hypothesis is true is only .006. (Nej, p-värdet är sannolikheten att få detta resultat om H₀ är sann, inte sannolikheten att H₀ är sann.) The probability of finding statistical significance if study is replicated is greater if p = .006 än om p = .02. (Ja, lägre p-värde tyder på större chans att få signifikans igen vid replikation.)
39
Vad är ett vanligt missförstånd om att inte förkasta nollhypotesen?
Missförstånd: Att inte förkasta nollhypotesen betyder att det inte finns någon skillnad mellan grupperna (t.ex. att en gammal behandling är lika bra som en ny). Korrekt: Ett icke signifikant resultat betyder bara att vi inte hittade tillräckligt stöd i datan för att dra en slutsats om en skillnad. Skillnad kan fortfarande finnas – till exempel om stickprovet är för litet eller om variationen är hög!
40
Hur påverkar p-värdet sannolikheten att kunna replikera ett resultat?
Lägre p-värden (t.ex. 0,001) → högre chans att replikera resultatet. Högre p-värden (t.ex. nära 0,05) → lägre chans till replikering. Samband: Mindre p → Större säkerhet att effekten är verklig och inte slump.
41
Vad betyder "power" i hypotesprövning?
Power = sannolikheten att upptäcka en verklig effekt (förkasta H₀ när H₀ är falsk). Power = 1 − β (β = risken för typ II-fel). Ju högre power, desto bättre är testet på att "se" en riktig effekt!
42
Hur kan man öka power i en studie?
Huvudsakligen genom att öka stickprovsstorleken! Påverkas också av: Signifikansnivå (α) Effektstorlek Rekommenderat att ha power på minst 0,8 (80% chans att upptäcka en verklig effekt).
43
Vad är syftet med en powerberäkning?
Syfte: Räkna ut hur många försökspersoner som behövs innan en studie startar. Verktyg: t.ex. G*Power (gratis program). Viktigt för att designa studier med tillräcklig power och undvika misslyckade tester.
44
Hur beräknar man hur många deltagare man behöver i en studie?
Målet: Power = 0,80 (80% chans att hitta en verklig effekt). Signifikansnivå α = 0,05 (5% risk att hitta en effekt av en slump). Antalet deltagare beror på: Effektstorlek: Stor effekt → Färre deltagare behövs. Liten effekt → Många deltagare behövs. Typ av test: t-test (jämförelse av två grupper) ANOVA (jämförelse av flera grupper) Exempel: Om du väntar dig en stor effekt i ett t-test → ca 26 deltagare per grupp. Om du väntar dig en liten effekt i ett t-test → ca 393 deltagare per grupp!
45
Vad innebär ett ensidigt (one-tailed) test?
Testar om A är större än B eller om B är mindre än A (en riktning). Man bryr sig bara om en specifik riktning. Om effekten går åt andra hållet fångar testet inte detta. Exempel: Du vill veta om en ny medicin minskar sjukdom – du bryr dig bara om minskning, inte om ökning.
46
Vad innebär ett tvåsidigt (two-tailed) test?
Testar om A är antingen större eller mindre än B. Upptäcker skillnader i båda riktningar. Exempel: Du vill veta om en ny medicin ändrar sjukdomsförloppet – det kan bli både bättre eller sämre, och du vill fånga båda.
47
Vad betyder p-värdet i ett statistiskt test?
P-värdet visar sannolikheten att få ett resultat lika extremt eller mer extremt än det vi observerat, om nollhypotesen är sann. Ett litet p-värde (t.ex. 0,03) betyder att det är osannolikt att vårt resultat beror på slumpen. Kort minnesregel: P-värde mäter: "Hur troligt är mitt resultat om ingen verklig effekt finns?"
48
Vad händer i ett tvåsidigt test?
Ett tvåsidigt test delar signifikansnivån (α = 0,05) i två delar (0,025 åt varje håll). Vi testar om värdet är antingen mycket större eller mycket mindre än nollhypotesens förväntade värde. Graf: Om ett resultat hamnar långt ut på någon sida → vi kan förkasta nollhypotesen.
49
Vad händer i ett ensidigt test?
Ett ensidigt test placerar hela signifikansnivån (0,05) på ena sidan av fördelningen. Vi testar bara om värdet är större (eller mindre) – inte båda riktningar. Graf: Om vi bara bryr oss om en riktning kan vi lättare hitta signifikans — men vi riskerar att missa en effekt åt andra hållet!
50
Varför rekommenderas tvåsidigt test nästan alltid?
Risk för fel om vi använder ensidigt test: ➔ Vi kan missa oväntade effekter. ANOVA är alltid tvåsidig. I princip används ensidigt bara om du i förväg vet exakt vilken riktning du bryr dig om. Rekommendation: Använd alltid tvåsidigt test om du är osäker.