Uge 17 - Comparing 3+ Means: ANOVA part 2 Flashcards
(46 cards)
Hvornår bruger man repeated measures ANOVA?
Når man er interesseret i at undersøge, hvordan tre eller flere betingelser (eng: conditions) adskiller sig på en kontinuerlig udfaldsvariabel (målbar, eks karakter, temperatur)
Hvad er fordelene ved repeated measures design?
- Mere præcise målinger, fordi hver person sammenlignes med sig selv, og dermed reduceres usystematisk variation, hvilket gør det lettere at opdage, om forsøget har en effekt
- Det er mindre ressourcekrævende, fordi der er behov for færre deltagere
Nævn de tre assumptions, som gælder for alle ANOVA tests.
- Udfaldsvariablen (det man måler) skal være kontinuerlig
- Man antager, at data følger en normalfordeling
- Der skal være 3 eller flere betingelser/grupper (hvis der kun er 2, bruges en t-test i stedet)
Hvilken assumption gælder (udover de tre andre) særligt for dependent tests?
Sphericity: Det betyder, at der skal være nogenlunde ens forskel mellem de forskellige tidspunkter/grupper.
Hvordan ved man, om antagelsen om sphericity er opfyldt?
Man undersøger, om disse variansforskelle er nogenlunde ens.
Hvis variansen af forskel A ≈ variansen af forskel B ≈ variansen af forskel C, siger man: Antagelsen om sphericity er opfyldt.
Hvordan tester man for sphericity?
Med Mauchly’s test i SPSS
Hvordan tolker man p-værdien ift sphericity?
Hvis p > (større end) 0,05, kan vi ikke afvise nulhypotesen → ✅ Det betyder, at sphericity er opfyldt (det er det, vi gerne vil have)
Hvis p < (mindre end) 0,05, skal vi afvise nulhypotesen → ❌ Det betyder, at sphericity er brudt (antagelsen er ikke opfyldt)
Når vi tester for sphericity, hvad gør vi så, hvis p < (mindre end) 0,05?
Vi retter i analysen - eks. ved at bruge en Greenhouse-Geisser-korrektion
Hvad gør en Greenhouse-Geisser-korrektion?
Den justerer frihedsgraderne, når sphericity er brudt
Hvad gør man, hvis ens assumptions for repeated measures ANOVA ikke er opfyldt, fordi man har ordinal data?
Brug den ikke-parametriske test i stedet – fx Friedmans test
Hvad gør man, hvis ens assumptions for repeated measures ANOVA ikke er opfyldt, fordi ens data ikke er normalfordelte?
Takket være CLT kan du ofte antage normalitet, hvis du har et stort datasæt ( mindst 30 personer).
Hvis du har få deltagere og problemer med normalitet, kan du:
1) Omforme data (fx log-transformation - altså tage log, kvadratrod osv), eller
2) Bruge en ikke-parametrisk test som Friedmans test
Field foreslår, at du altid rapporterer en korrektion for sphericity - hvilke to korrektioner er der?
- Greenhouse-Geisser
- Huynh-Feldt (Kan bruges, hvis Greenhouse-Geisser’s epsilon (ε) er over 0,75.)
Hvad er de 5 steps i en repeated measures (dependent) one-way ANOVA
- Beregn ANOVA (F-)statistikken (i SPSS)
- Undersøg om F-værdien er signifikant (dvs. om der er en reel forskel mellem målingerne - altså vi tjekker, om p-værdien er under 0,05 → det betyder, der er en forskel et eller andet sted)
- Lav opfølgende tests for at finde ud af, hvilke målinger/betingelser der er forskellige fra hinanden (fx mellem T1 og T2, T2 og T3)
– men kun hvis hovedtesten er signifikant
– beregn også effektstørrelse, hvis det er relevant - Fortolk resultaterne i forhold til nulhypotesen (er den afvist eller ej?)
- Rapportér dine resultater (i tekst, tabel eller figur, som passer til analysen)
Hvad er F (ifølge formlen)?
Et forhold mellem effekt og fejl.
Hvad betyder en høj F-værdi?
Jo større F-værdien er, jo mere sandsynligt er det, at forskellen ikke bare skyldes tilfældigheder, men faktisk skyldes forsøget
Hvordan opdeles varians i independent test?
MSMODEL (måler forskelle mellem grupper)
MSRESIDUAL (måler forskelle inden for hver gruppe)
Hvordan opdeles varians i dependent test?
SSbetween (ikke relevant)
SSwithin participant = den samlede varians inden for personer. Denne bliver igen opdelt i de to nedenstående:
MSmodel = Systematisk varians
MSresidual = Usystematisk varians
Hvad måler formlen for SSw (sum of squares within)?
SSw måler, hvor meget deltagerne i samme gruppe afviger fra deres gruppes gennemsnit.
Det viser, hvor stor spredning der er indenfor hver gruppe
Hvad måler formlen for SSm (Model Sum of Squares)?
Måler den systematiske variation mellem betingelserne (fx forskellen i opkasttid mellem de forskellige madtyper)
Hvad finder formlen for SSr (Residual Sum of Squares)?
Kaldes også fejlleddet - Det er den usystematiske variation inden for personer, som ikke kan forklares af forskellen mellem betingelserne
Hvorfor er vi interesseret i at finde mean square for både SSm og SSr?
SSM og SSR bliver større, jo flere observationer vi har, fordi vi lægger flere kvadrerede forskelle sammen, bliver den samlede sum naturligt højere.
Derfor “standardiserer” vi kvadratsummen ved at dele med df. Det giver os en mere fair sammenligning – uanset hvor mange observationer vi har.
Hvad betyder en høj F-værdi?
En høj F-værdi gør det mere sandsynligt, at vi kan forkaste nulhypotesen (altså: at der faktisk er en forskel).
Hvad er de kritiske værdier for signifikans?
< 0,05, < 0,01, < 0,001
Hvordan finder vi de kristiske værdier for F?
Ved at slå op i vores tabel med kritiske værdier med både df_model og df_residual