ANOVA Flashcards
(35 cards)
När används envägs variansanalys?
ANOVA är en statistisk metod som används för att ta reda på om stickprovsmedelvärden skiljer signifikant från från varandra. Vid envägs variansanalys studeras effekterna av en oberoende variabel på en beroende variabel.
Vad säger noll- respektive alternativhypotesen vid envägs variansanalys?
H0: μ1 = μ2 = μ3 (det finns ingen skillnad)
H1: μ1 ≠ μ2 ≠ μ3 (det finns en skillnad)
Vad anger den s.k. F-kvoten?
F-kvoten räknas ut genom att man dividerar Mean square between med Mean sqaure within.
Om F-kvoten är större än den kritiska gränsen så kan vi förkasta nollhypotesen. Den kritiska gränsen är beroende av den alfanivå och frihetsgrader som vi använt oss av.
Om nollhypotesen stämmer vid envägs variansanalys, vad förväntas F-kvoten bli?
1
Hur ser förhållandet mellan F-kvoten och sannolikheten för att nollhypotesen stämmer ut?
Ju högre F-kvoten är desto mindre är sannolikheten att H0 är sann.
SS total
Total variation i datamaterialet. Summan av alla individers kvadrerade avvikelser från totalmedelvärdet.
SS between
Mellangruppsvariation. Om man har olika många personer i de olika grupperna beräknar man för varje grupp produkten av antalet personer i gruppen och gruppmedelvärdets kvadrerade avvikelse från totalmedelvärdet. Sen lägger man ihop alla dessa produkter.
SS within
Inomgruppsvariation. Summan av alla individers kvadrerade avvikelser från sina gruppmedelvärden.
Df between
Antalet grupper minus ett
Df within
Antalet individer minus antalet grupper
Df total
Antalet individer minus ett
Mean square (between)
Medelkvadratsumman mellan grupper. Ju större detta värde blir desto större är mellangruppsvariationen. Dividera SS Between med frihetsgraderna J - 1, där J är antalet grupper.
Mean square (within)
Medelkvadratsumman inom grupperna. Ju större detta värde blir desto större är inomgruppsvariationen. Dividera SS within med frihetsgraderna Σ(n-1), där n är antalet individer inom en specifik grupp.
Vad anger sig.-värdet?
Sannolikheten för att skillnaden mellan grupperna beror på slumpen.
Varför utförs s.k. Post Hoc test ofta i samband med variansanalys? Nämn namnet på minst två olika Post Hoc test.
ANOVA mäter bara om det finns en skillnad mellan grupperna, man får ingen vidare, mer detaljerad, information om hur de skillnaderna ser ut. Post Hoc-test ger möjligheten att se tydligare info om skillnaden mellan grupperna.
Exempel: Fischer’s LSD, Tukey HSD
Beskriv tre antaganden vid variansanalys.
- Antagandet om normalfördelade populationer - Egenskapen som mäts antas vara normalfördelad i populationen. För att få tillförlitliga resultat (alltså att typ-1 fel inte är större än den alfa-nivå man bestämt) måste stickproven också vara representativa för resten av populationen om man ska kunna generalisera sitt resultat. Dock fungerar envägs oberoende ANOVA relativt bra även vid stora avvikelser från normalfördelningen.
- Antagandet om homogena populationsvarianser - Vilket innebär att variansen på den aktuella beroende variabeln är densamma i alla populationer.
- Antagandet om observationer ska vara oberoende. Man ska inte mäta samma individer flera gånger och inte heller dela upp individerna med hjälp av någon bakgrundsvariabel och sedan gruppera individer med liknande värden på den bakgrundsvariabeln i subgrupper (såvida det inte just är effekten av denna bakgrundsvariabel man vill testa!).
Vad menas med ”fixed” respektive ”random” oberoende variabler?
Fixed:
- Om vi bara har bestämt nivåerna i OV
- Om vi bara “tagit vad vi får”
- Om vi använt alla nivåer som är av intresse
Random:
- Om vi valt nivåerna slumpmässigt ur populationen av alla möjliga nivåer
Att slumpmässigt avgöra nivåer på OV minskar risken för att vi ska välja värden som ger en bild på ett samband som egentligen inte finns/ser ut på ett annat sätt. Fixed nivåer på OV ökar t.ex.risken för att icke-linjära samband ser linjära ut.
Vad (ungefär) anger effektstorleken vid variansanalys? Ange två olika effektmått.
Hur mycket (i procent) av variansen mellan individer som kan förklaras av vilken grupp de tillhör.
Effektmått: Eta- squared (samma sak som R² i regressionsanalys).
Omega- squared (mindre biased än föregående, men mer konservativt).
Eta-squared har som mest bias vid små och många stickprov. Med få, stora stickprov blir skillnaden mot omega-squared mindre.
När används tvåvägs ANOVA?
Vid faktoriell design, där individer tillhör olika kombinationer av grupper på två olika oberoende variabler.
Huvudeffekter
Hur värden i den beroende variabeln (här livsglädje) varierar mellan nivåerna på den oberoende variabeln X (här kön) över alla nivåer på den oberoende variabeln Y (alla andra oberoende variabler som är med).
T.ex. om vi ska kolla på huvudeffekten av kön på t.ex. livsglädje, så kollar vi hur kön påverkar livsglädje (oavsett alla andra variabler t.ex. behandling)
Enkla effekter
Hur värdena i den beroende variabeln varierar mellan nivåerna på den oberoende variabeln X (kön) för en viss nivå på den oberoended variabeln Y (här behandling)
T.ex. Hur påverkar behandling livsglädje endast för kvinnor?
Interaktionseffekter
Om den enkla effekten av den oberoende variabeln X ser olika ut för olika nivåer av den andra oberoende variabeln Y så sägs X och Y interagera i sin effekt på den beroende variabeln.
T.ex. effekten av behandling ser olika ut för kvinnor och män, blir en interaktionseffekt av kön och behandling.
Hur beräknas variationen (Sum of Squares och Mean Squares) som kan tillskrivas interaktionen mellan de oberoende variablerna vid en tvåvägs ANOVA. Ge ett konkret exempel.
SS Kön x Beh = SS Cell – SS Kön ‐ SS Beh
Vad brukar inträffa med F-kvoten för effekten av en viss oberoende variabel om man tar med ytterligare en oberoende variabel i analysen? Varför?
F-värdet brukar bli högre.
Varför? Genom att ta hänsyn till ännu en oberoende variabel samt interaktionen mellan de oberoende variablerna så sjunker felvariansen (vi får lägre error vid tvåvägsanalys). Då blir F-värdet för effekten av behandling högre (analysen får högre power).