U14 Non-lineariteter og post treatment-bias Flashcards
(13 cards)
Non-linearitet
Sammenhæng mellem X og Y, hvor effekten af X afhænger af X’s værdi (fx ikke konstant hældning).
En sammenhæng, hvor hældningskoefficienten ”afhænger af X”, dvs. hvor regressionslinjen har ikke samme hældning på tværs af X.
Betyder også, at marginaleffekten af X ikke er konstant.
Logaritmetransformation:
Generelt: Transformering af variable, men ikke en anden regressionsmodel.
Lineær-log: Logtransformation af uafhængig variabel (X)
- Brug hvis sammenhængens styrke er aftagende over X = gulv- eller loftseffekter
Log-lineær: Logtransformation af afhængig variabel (Y)
- Brug hvis sammenhængens styrke er tiltagende ved større X
Log-log: Logtransformation af både X og Y
- Brug primært, hvis teoretisk grund til at tænke i elasticitet, dvs., procentvise ændringer i begge
Andengradspolynomium (X²)
Andengradsled (X²) til at fange kurvelineære sammenhænge (fx parabler).
Modellerer kurvelineær effekt (fx ∩- eller U-formet).
β 1 : Hældning ved X=0.
β 2: Ændring i hældning pr. enhedsændring i X.
Post-treatment bias
Bias der opstår, når man kontrollerer for en variabel (M), der er en konsekvens af X.
Opstår, når man kontrollerer for variable, der er påvirket af behandlingen (X), hvilket fjerner den effekt, man ønsker at måle.
Eksempel: At kontrollere for “anbefaling efter studiejob” undervurderer effekten af “studieindkomst” på Y, da indkomst påvirker anbefalingen.
Inklusion af kontrolvariable, der påvirkes af X eller kommer efter X i tid. Her kontrollerer vi for variation, som vi er interesserede i
Kan også være bias, der opstår ved systematisk frafald som følge af treatment: Gør at potentielle outcomes mellem grupperne ikke længere er ens.
Kan også være eksklusion/udeladelse af observationer på baggrund af post-treatment kriterier, f.eks. ved at droppe observationer, der fejlede manipulationstjek.
Mediation:
Processen hvor X påvirker Y gennem M (fx uddannelse → social tillid → politisk holdning).
Ønsket om at forstå mekanismer (M) gennem hvilke X påvirker Y.
Problem: Klassisk mediationanalyse (Baron & Kenny) kan introducere selektionsbias, hvis M er korreleret med fejlledet.
Moderne tilgang: Test X → M og M → Y separat, eller randomiser M for at undgå bias.
Selektionsbias
Systematisk forskel mellem grupper, der ikke skyldes behandlingen (fx pga. udeladte variable).
ACPR-plot (Partial Residual Plot)
Graf til at vurdere linearitet efter kontrol for andre variable.
IQR (Interkvartilafstand)
Brugt til substantiel fortolkning af effekter (fx sammenligning mellem 25. og 75. percentil).
Diagnosticering af nonlinearitet
Primært visuelt, dvs. sammenligning af line of fit med lowess-kurve. Alternativt: scatterplot
ACPR-plot for MLR.
Hvis lineær-log eller polynomisk regression: Sammenligning af R2.
Hvis logtransformation af Y: ingen sammenligning af R2
Fortolkning af koefficienter (Logaritmefunktion)
Lineær-log: Y stiger lineært, når X stiger med 1% (fortolkning: β 1 / 100.
Log-lineær: Y stiger med β 1 × 100 %, når X stiger med 1 enhed.
Log-log: Både X og Y logges; β 1 fortolkes som elastictet (procentvis ændring i Y ved 1% ændring i X).
Polynomisk regression
Regressionsmodel, der indeholder et potenseret led.
Potens: Afgør antal ”knæk” i kurven (potens minus ét knæk.
Er derfor en alternativt specificeret regressionsmodel, og ikke blot en transformation.
Specifikation (andengrads): E(Y) = B0+B1X+B2X2
Bruges sammenhængen mellem X og Y er parabelformet
B0: Skæring med Y-akse, dvs. for X = 0
B1: Hældning på kurve, når X = 0
B2: Afgør hvilken retning, parablen vender
- Negativ B2: Grene vender nedad
- Positiv B2: Grene vender opad
Men generelt svært at tolke. Kig derfor på marginaleffekter.
Mediationsanalyse og problemer hermed
Mediation: Effekt af X på Y går gennem tredjevariabel M
Motivation: ”Isolering af X effekt på Y ved at tjekke for, om effekt af X går gennem M”.
Grundlæggende problem: Dette medfører post-treatment bias
Selv hvis X er tilfældigt tildelt kan M, stik imod at klarlægge den kausale mekanisme, skabe selektionsbias, specielt hvis M ikke selv er tilfældigt tildelt.
Er endnu større problem ved observationel-/tværsnitsdata
Confounding
refererer til en situation, hvor en tredje variabel (kaldet en confounder) påvirker både den uafhængige variabel (X) og den afhængige variabel (Y), hvilket forvrænger den observerede sammenhæng mellem X og Y. (Det er bare Z variabel)
Vi fjener confounding ved at kontrollere for Z