begrippen Flashcards
(21 cards)
A veroorzaakt direct B
- Hoe heet deze relatie?
Directe causale relatie
A en B delen dezelfde oorzaak (bijvoorbeeld leeftijd)
- Hoe heet deze relatie?
(spurious) onechte associatie
A beïnvloed B via een derde variabele C
- Hoe heet deze relatie?
(Chain) indirecte relatie
Relatie tussen A & B en varieert afhankelijk van variabele C
- Hoe heet deze relatie?
Moderende variabele
Een afwezige relatie wordt zichtbaar zodra er een variabele C wordt gevonden
- Hoe heet deze relatie?
Suppressor variabele
Random variatie leidt soms tot een foute associatie
- Hoe heet deze relatie?
Toeval/coincidence
Een aanwezige correlatie verdwijnt zodra er een variabele C wordt gevonden
- Hoe heet deze relatie?
Lurking variabele
Trend in afhankelijke groepen keert om als data wordt samengevoegd (waarschijnlijk door een verborgen confounder zoals leeftijd)
Simpsons paradox
Bij influential observation waar moet je dan naar kijken om een outlier te vinden?
Als de Cooks distance groter is dan 1 heb je met een outlier te maken (D1 >1)
Wat toetst de F toets? Geef ook de formule
De F-toets toetst de globale significante van het model
F = MSModel/MSError
de 4 assumpties bij lineaire regressie
- Data is ONAFHANKELIJK
- Relatie tussen data is LINEAIR
- Homoscedasticiteit
- Residuals zijn NORMAAL VERDEELD
Wat is inferentie? Welke twee toetsen zijn essentieel?
Is het verband wat je ziet ook echt in de populatie? BHI’s en hypothesetoetsen zijn essentieel om de onzekerheden te kwantificeren.
Wat betekent de Y
De response/dependent variabele - variabele die je wilt voorspellen
Wat betekent de X?
Explanatory/independent/predictor - variabele die een verklarende rol heeft
Hoe heet de ‘beste lijn’ die zo dicht mogelijk langs alle puntjes gaat –> Het lukt bijna nooit om precies door alle puntjes te gaan waardoor er ruimte (residuals) over blijft tussen de lijnen en de puntjes
Ordinary Least Squares methode (OLS)
Hoe bereken je de R2 met een JASP tabel?
SSRegression / SSTotal
Correlatie bereken je door hier de wortel uit te halen.
Wanneer krijg je een scheve verdeling van r?
Bij een kleine steekproef of een extreme correlatie dichtbij de 1 of 0
R2 formule ANOVA tabel multiple regression
Tussen welke 2 getallen ligt de R2?
R2= SSM/SST
R2 ligt altijd tussen de 0 en 1 (perfecte lineaire relatie)
MSM formule
MSM = SSM/DFM
MSE formule
SSE / DFE