U20 Statistisk power og replikationskrisen Flashcards
(16 cards)
Statistisk Power
Sandsynligheden for at korrekt afvise en falsk nulhypotese (opdage en sand effekt)
Lav power øger risikoen for Type II-fejl (ikke at opdage en eksisterende effekt).
Power kan øges ved:
At forøge stikprøvestørrelsen.
At vælge en større minimal detectable effect size (MDE).
At reducere standardafvigelsen (f.eks. ved at inkludere relevante kontrolvariable).
Praktisk anvendelse: Power-beregninger bruges til at planlægge studier og vurdere, om eksisterende data er tilstrækkelige til at opdage meningsfulde effekter.
Replikationskrisen
Mange videnskabelige resultater kan ikke gentages, hvilket underminerer forskningens troværdighed.
Årsager inkluderer:
P-hacking: Manipulation af analyser for at opnå signifikante resultater.
HARKing: Opfindelse af hypoteser efter dataanalyse.
Selective reporting: Kun rapportering af signifikante resultater.
Løsninger:
Præ-registrering: Fastlæggelse af hypoteser og metoder før dataindsamling.
Sensitivitetsanalyser: Test af robusthed ved forskellige modeltilgange.
Fokus på effektstørrelser fremfor kun signifikans.
Minimal Detectable Effect Size (MDE)
Den mindste effektstørrelse, et studie kan opdage med en given power.
Standardafvigelse (SD)
Mål for spredningen i data; lavere SD øger power.
Præ-registrering
Registrering af hypoteser og metoder før dataindsamling for at reducere bias.
P-hacking
Manipulation af analyser (f.eks. udeladelse af outliers eller valg af specifikke variable) for at opnå signifikans.
HARKing (Hypothesizing After Results are Known)
Opfindelse af hypoteser efter at have set data for at matche resultaterne.
Reproducerbarhed
Mulighed for at gentage en analyse med samme data og metode.
Replicerbarhed
Mulighed for at opnå lignende resultater med nye data eller metoder.
Signifikansfilteret
Tendens til kun at publicere resultater, der er statistisk signifikante (p < 0,05).
Sensitivitetsanalyser
Test af, hvor robuste resultater er ved variation i modeltilgange (f.eks. inklusion/eksklusion af kontrolvariable).
Kumulativ Forskning
Forskning, der bygger på tidligere resultater frem for at søge “banebrydende” fund.
Open Science
Bevægelse mod større gennemsigtighed (deling af data, kode og præ-registrering).
Vigtige Takeaway-points: (Statistisk power)
Statistisk power er afgørende for at undgå falske negative resultater.
Replikationskrisen viser behov for mere robust forskningspraksis (f.eks. præ-registrering og open science).
P-hacking og HARKing underminerer troværdigheden; løsninger inkluderer bedre incitamenter og metodisk strenghed.
Sensitivitetsanalyser og fokus på effektstørrelser fremfor kun p-værdier kan forbedre forskningens kvalitet.
Vurdering af intern validitet
- Udeladt variabel bias (selektionsbias)?
- Korrekt specificeret regression? (f.eks. lineær model for nonlineær sammenhæng i pop.)
- Systematiske målefejl?
- Manglende data (missing)
- Omvendt kausalitet?
- Heteroskedasticitet?
Vurdering af ekstern validitet
På baggrund af tre dimensioner
1) Målingsvaliditet (både begreber og treatment)
2) Setting
3) Population
Eksperimentel realisme: Eksperimentsubjekternes oplevelse af eksperimentets grad af realisme
Mundan realisme: Eksperimentets grad af overensstemmelse med den ”virkelige verden”