T4.2 Multipele regressie Flashcards
(32 cards)
Wat wordt bedoeld met multipele regressie-analyse en hoe verschilt het van enkelvoudige regressie-analyse?
Multipele regressie-analyse is een uitbreiding van enkelvoudige regressie-analyse waarbij meerdere voorspellers worden gebruikt om een afhankelijke variabele te voorspellen. In tegenstelling tot enkelvoudige regressie-analyse, waar slechts één voorspeller wordt gebruikt, kunnen bij multipele regressie-analyse meerdere voorspellers worden opgenomen in het model.
Wat wordt bedoeld met het structurele model bij multipele regressie-analyse?
Het structurele model bij multipele regressie-analyse bestaat uit meerdere voorspellers (aangeduid als ‘x1’, ‘x2’, en ‘x3’ in de figuur) die elk een relatie hebben met een afhankelijke variabele (aangeduid als ‘y’ in de figuur). De pijlen van de voorspellers naar de afhankelijke variabele vertegenwoordigen de veronderstelde causale relaties tussen deze variabelen.
Waarom wordt multipele regressie-analyse beschouwd als relatief eenvoudig te begrijpen als je enkelvoudige regressie-analyse begrijpt?
Multipele regressie-analyse bouwt voort op de principes van enkelvoudige regressie-analyse, waarbij slechts één voorspeller wordt gebruikt. De basisconcepten, zoals het voorspellen van een afhankelijke variabele op basis van voorspellers, en de interpretatie van regressiecoëfficiënten, blijven hetzelfde.
Wat zijn enkele uitdagingen of complexiteiten die gepaard gaan met multipele regressie-analyse?
Enkele uitdagingen bij multipele regressie-analyse zijn onder andere het omgaan met collineariteit tussen voorspellers, het identificeren van de juiste voorspellers om op te nemen in het model, en het interpreteren van de gecombineerde effecten van meerdere voorspellers op de afhankelijke variabele.
Wat is de regressievergelijking voor multipele regressie en wat vertegenwoordigen de verschillende componenten?
De regressievergelijking voor multipele regressie wordt weergegeven als:
^y=b0 + b1 x1 + b2 x2 +….+bn xn
In deze vergelijking staat ^y
voor de voorspelling van de afhankelijke variabele, b0 vertegenwoordigt het intercept (het punt waar de lijn de y-as snijdt), en elke b staat voor een regressiecoëfficiënt die bij een specifieke voorspeller x hoort.
Wat betekent het intercept in de regressievergelijking voor multipele regressie?
Het intercept (b0)
in de regressievergelijking voor multipele regressie vertegenwoordigt de voorspelde waarde van de afhankelijke variabele (y) wanneer alle voorspellers (x) gelijk zijn aan nul. Het geeft dus de waarde van y op het moment dat alle andere voorspellers geen effect hebben.
Wat vertegenwoordigen de regressiecoëfficiënten (b1,b2,…,bn) in de regressievergelijking?
De regressiecoëfficiënten (b1,b2,…,bn) in de regressievergelijking voor multipele regressie geven de mate van verandering aan in de voorspelde waarde van de afhankelijke variabele (^y) voor een eenheidstoename in de overeenkomstige voorspeller (x)
b vertegenwoordigt dus het effect van een specifieke voorspeller op de afhankelijke variabele, rekening houdend met de andere voorspellers in het model.
Hoe wordt de proportie verklaarde variantie (R²) berekend in multipele regressie-analyse en wat vertegenwoordigt het?
De proportie verklaarde variantie (R²) in multipele regressie-analyse wordt berekend als het kwadraat van de multipele correlatie (R), die de correlatie tussen de beste voorspelling van de afhankelijke variabele (^y) en de geobserveerde waarden van de afhankelijke variabele (y) vertegenwoordigt. Het wordt berekend met de formule:
R^2=r^2 ^y,y
waarbij ^y,y
de correlatiecoëfficiënt is tussen de voorspelde waarden en de geobserveerde waarden van de afhankelijke variabele.
Hoe wordt de multipele correlatie (R) berekend en wat vertegenwoordigt het?
De multipele correlatie (R) is de correlatie tussen de voorspelde waarden van de afhankelijke variabele (^y) en de geobserveerde waarden van de afhankelijke variabele (y). Het wordt berekend door de correlatiecoëfficiënt te berekenen tussen deze voorspelde en geobserveerde waarden.
Wat is de relatie tussen R en R² in multipele regressie-analyse?
De proportie verklaarde variantie (R²) in multipele regressie-analyse is het kwadraat van de multipele correlatie (R). Dit betekent dat de proportie verklaarde variantie het percentage van de variantie in de afhankelijke variabele vertegenwoordigt dat wordt verklaard door de voorspellers in het regressiemodel.
Wat is de steekproevenverdeling van de parameters in het regressiemodel en hoe wordt deze vaak weergegeven?
De steekproevenverdeling van de parameters in het regressiemodel (b0,b1,b2,bn) is de
t-verdeling. Deze verdeling wordt vaak gebruikt om de betrouwbaarheidsintervallen en hypothesetoetsen voor de regressiecoëfficiënten uit te voeren.
Hoe wordt de steekproevenverdeling van de proportie verklaarde variantie (R2 ) vaak benaderd en waarom?
De steekproevenverdeling van de proportie verklaarde variantie (R2) is niet eenvoudig met de hand te berekenen. Vaak wordt echter de
F-verdeling gebruikt om de
p-waarde te berekenen die aangeeft hoe waarschijnlijk het is om de gevonden
R2 te verkrijgen als er geen verband is tussen de voorspellers en de afhankelijke variabele in de populatie. Dit wordt gedaan in het kader van nulhypothesesignificantietoetsing (NHST).
24.5
Voorbeeld lezen!!!
Wat zijn de aannames van multipele regressie-analyse?
De aannames van multipele regressie-analyse zijn vergelijkbaar met die van enkelvoudige regressie-analyse, met de toevoeging van de zachte aanname dat er geen multicollineariteit mag zijn tussen de voorspellers.
Wat is multicollineariteit en welke gevolgen heeft het voor een regressiemodel?
Multicollineariteit verwijst naar het scenario waarin de voorspellers goed voorspelbaar zijn uit elkaar. Het resulteert in minder informatie beschikbaar in het regressiemodel, wat zich vertaalt naar grotere standaardfouten en bredere betrouwbaarheidsintervallen.
Hoe kan multicollineariteit worden opgelost?
Multicollineariteit kan worden opgelost door meer deelnemers te werven, wat vereist dat men van tevoren verwachtingen heeft over de samenhang tussen de voorspellers. De effectieve steekproefomvang kan worden berekend door de oorspronkelijke steekproefomvang te vermenigvuldigen met 1-r2
Wat zijn de mogelijke gevolgen van het negeren van multicollineariteit in een regressie-analyse?
Het negeren van multicollineariteit kan resulteren in onnauwkeurige schattingen en onvoldoende power in vergelijking met het onderzoeksvoorstel. Dit kan leiden tot onbetrouwbare conclusies en ethische kwesties met betrekking tot de vereiste steekproefomvang.
Hoe kan multicollineariteit worden onderzocht in een dataset?
Multicollineariteit kan worden onderzocht door statistische technieken zoals de variantie-inflatiefactor (VIF) en tolerantie te gebruiken. Deze twee zijn elkaars reciproke en geven inzicht in de mate van multicollineariteit in de dataset.
Wat gebeurt er als voorspellers in een multivariate analyse met elkaar correleren?
Wanneer voorspellers in een multivariate analyse met elkaar correleren, kan dit te wijten zijn aan het feit dat ze constructen vertegenwoordigen die conceptueel overlappen, wat kan leiden tot problemen bij het verklaren van de afhankelijke variabele.
Wat is het probleem met overlappende voorspellers in een multipele regressie-analyse?
In een multipele regressie-analyse kan het probleem van overlappende voorspellers optreden omdat de verklaarde variantie in de afhankelijke variabele tegelijkertijd bij beide voorspellers hoort, waardoor de interpretatie van de regressiecoëfficiënten problematisch wordt.
Hoe kunnen overlappende voorspellers worden geïdentificeerd?
Overlappende voorspellers kunnen worden geïdentificeerd door te controleren of de definities van de constructen, de operationalisaties en de items in de meetinstrumenten niet dezelfde aspecten van de menselijke psychologie afdekken.
Waarom zijn bivariate analyses soms meer geschikt dan multivariate analyses bij overlappende voorspellers?
Bij overlappende voorspellers kunnen bivariate analyses, zoals correlaties, soms meer geschikt zijn dan multivariate analyses, omdat multivariate analyses problemen kunnen veroorzaken bij het interpreteren van de resultaten vanwege de overlappende variantie in de voorspellers.
Hoe worden dichotome voorspellers vaak gerepresenteerd in regressie-analyse?
Dichotome voorspellers, die slechts twee mogelijke meetwaarden hebben, worden vaak gerepresenteerd door de ene meetwaarde als 0 en de andere als 1, waardoor ze als intervalvariabelen worden beschouwd.
Wat is het belang van het coderen van dichotome variabelen in regressie-analyse?
Bij het coderen van dichotome variabelen in regressie-analyse is het belangrijk om consistentie te behouden, omdat het uitmaakt welke categorie als 0 en welke als 1 wordt gecodeerd om juiste interpretaties van de parameters te verkrijgen.