U18 Difference-in-Differences Flashcards
(13 cards)
Difference-in-Differences (DiD)
en metode til kausal inferens, der sammenligner udviklingen i en afhængig variabel (Y) mellem en behandlet gruppe (treatment) og en kontrolgruppe over tid.
Parallel Trends
Central antagelse for fravær af selektionsbias i DiD.
Antagelse om, at grupperne ville have fulgt samme trend uden Treatment.
DiD forudsætter, at treatment og kontrolgruppe ville have udviklet sig ens i fravær af behandling.
Valideres ved at tjekke præ-intervention trends eller ved at bruge flere tidsperioder.
Advarsel: Hvis antagelsen brydes, introduceres selektionsbias.
Hvis parallelle trends antagelsen kan teoretisk eller empirisk (dvs. at kigge på pre-treatment data for TG og KG) sandsynliggøres, så kan vi antage, at de to grupper har ens potentielle udvikling i outcomes = fravær af selektionsbias.
KG udgør altså TG’s ”kontrafaktiske” udvikling.
Tidsinvariante faktorer
Variable der ikke ændrer sig over tid (fx køn, geografi) – kontrolleres automatisk i DiD.
Autokorrelation
Korrelation mellem gentagne målinger af samme enhed; håndteres med klyngerobuste standardfejl.
Klyngerobuste standardfejl
Justering for afhængighed mellem observationer i samme klynge (fx samme person/distrikt over tid).
Repeated Cross-Sections
Data hvor forskellige enheder måles på forskellige tidspunkter (ikke paneldata).
Data hvor nye enheder måles over tid (ikke de samme individer) kræver ekstra antagelser om fravær af sampling bias.
I R (DiD)
Brug lm() til modellen og vcovCL() fra sandwich-pakken til klyngerobuste standardfejl.
Naturlige/kvasi-eksperimenter
Eksperimenter, der opfylder 1) treatmenttildeling er exogent givet og 2) treatmenttildeling er as-if random, dvs. kvasi-eksperimentets tildelingsmekanisme er usystematisk og specifikt ukorreleret med den afhængige variabel.
F.eks: Kommunesammenlægning og administrationsomkostninger
Hvis sammenlægningen af kommune f.eks. blev afgjort af, at kommune med høje admin. costs i større grad blev lagt sammen, ville tildelingsmekanismen ikke være as-if random
Påkrævet data og variable
Panel data/gentagne tværsnit. Mindst to gruppe-enheder (TG og KG) til to forskellige tidspunkter (pre- og post-treatment)
Men flere pre-treatment og post-treatment måletidspunkter er fordelagtige til at vurdere parallelle trends-antagelsen og til at vurdere treatments, der tager tid ”før det virker” (e.g., administrationsudgifter og kommunesammenlægninger).
Kræver dummy-variabel, der angiver om enhed tilhører TG eller KG
Kræver tidsvariabel (min. to tidspunkter), der angiver før og efter treatment
Kræver data i langt format (hver observation for samme enhed er sin egen række), dvs. selvstændig række for hvert måletidspunkt for hver enhed.
Modelspecifikation og fortolkning (DiD)
Modelleres som interaktion: E(Y)=B0+B1X+B2Z+B3XZ
B0: Kontrolgruppens pretreatment udgangspunkt
B1: TG’s forskel til KG pretreatment (her kan vi altså udregne TG’s udgangspunkt).
B2: Udvikling i kontrolgruppe
B3 (DiD-estimator): Forskel i udvikling ml. TG og KG
Derfor også:
B0+B1: Treatmentgruppens udgangspunkt
B0+B2: Kontrolgruppen efter treatment
B0+B1+B2+B3: Treatmentgruppen efter treatment
DiD og kausal inferens
DiD er et stærkt intern validt forskningsdesign, der under antagelse af parallelle trends og en tilfældig treatment-tildelingsmekanisme kontroller for alle tidsinvariante forskelle og alt fælles tidsvariant mellem TG og KG.
Sikrer derfor fravær af selektionsbias; eller i hvert fald fravær af uens potentielle udviklinger i outcomes.
Her kan DiD-estimatoren tolkes som den (gennemsnitlige) kausale effekt
Fordele ved DiD
Kontrollerer for tidsinvariante confounding-faktorer (fx geografi, personlighed) uden eksplicit at måle dem.
Forbedrer intern validitet sammenlignet med tværsnits- eller tidsseriestudier.
Udvidelser:
Kontinuerte behandlinger: DiD kan anvendes med gradvis behandling (fx forskellige niveauer af krisehjælp).
Kontrolvariable: Inkluderes for at håndtere resterende tidsvarierende confounding.
Vigtig pointe: (DiD)
DiD er kraftfuld, men parallel trends-antagelsen er afgørende. Brug præ-intervention data eller placebo-tests til at vurdere dens rimelighed.
Visualisering: Plot trends før/efter intervention for at vurdere parallelitet.
Dokumenter altid parallel trends-test i din analyse.