T4.2 Multipele regressie Flashcards

(32 cards)

1
Q

Wat wordt bedoeld met multipele regressie-analyse en hoe verschilt het van enkelvoudige regressie-analyse?

A

Multipele regressie-analyse is een uitbreiding van enkelvoudige regressie-analyse waarbij meerdere voorspellers worden gebruikt om een afhankelijke variabele te voorspellen. In tegenstelling tot enkelvoudige regressie-analyse, waar slechts één voorspeller wordt gebruikt, kunnen bij multipele regressie-analyse meerdere voorspellers worden opgenomen in het model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat wordt bedoeld met het structurele model bij multipele regressie-analyse?

A

Het structurele model bij multipele regressie-analyse bestaat uit meerdere voorspellers (aangeduid als ‘x1’, ‘x2’, en ‘x3’ in de figuur) die elk een relatie hebben met een afhankelijke variabele (aangeduid als ‘y’ in de figuur). De pijlen van de voorspellers naar de afhankelijke variabele vertegenwoordigen de veronderstelde causale relaties tussen deze variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waarom wordt multipele regressie-analyse beschouwd als relatief eenvoudig te begrijpen als je enkelvoudige regressie-analyse begrijpt?

A

Multipele regressie-analyse bouwt voort op de principes van enkelvoudige regressie-analyse, waarbij slechts één voorspeller wordt gebruikt. De basisconcepten, zoals het voorspellen van een afhankelijke variabele op basis van voorspellers, en de interpretatie van regressiecoëfficiënten, blijven hetzelfde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat zijn enkele uitdagingen of complexiteiten die gepaard gaan met multipele regressie-analyse?

A

Enkele uitdagingen bij multipele regressie-analyse zijn onder andere het omgaan met collineariteit tussen voorspellers, het identificeren van de juiste voorspellers om op te nemen in het model, en het interpreteren van de gecombineerde effecten van meerdere voorspellers op de afhankelijke variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is de regressievergelijking voor multipele regressie en wat vertegenwoordigen de verschillende componenten?

A

De regressievergelijking voor multipele regressie wordt weergegeven als:

^y=b0 + b1 x1 + b2 x2 +….+bn xn

In deze vergelijking staat ^y

voor de voorspelling van de afhankelijke variabele, b0 vertegenwoordigt het intercept (het punt waar de lijn de y-as snijdt), en elke b staat voor een regressiecoëfficiënt die bij een specifieke voorspeller x hoort.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat betekent het intercept in de regressievergelijking voor multipele regressie?

A

Het intercept (b0)
in de regressievergelijking voor multipele regressie vertegenwoordigt de voorspelde waarde van de afhankelijke variabele (y) wanneer alle voorspellers (x) gelijk zijn aan nul. Het geeft dus de waarde van y op het moment dat alle andere voorspellers geen effect hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat vertegenwoordigen de regressiecoëfficiënten (b1,b2,…,bn) in de regressievergelijking?

A

De regressiecoëfficiënten (b1,b2,…,bn) in de regressievergelijking voor multipele regressie geven de mate van verandering aan in de voorspelde waarde van de afhankelijke variabele (^y) voor een eenheidstoename in de overeenkomstige voorspeller (x)
b vertegenwoordigt dus het effect van een specifieke voorspeller op de afhankelijke variabele, rekening houdend met de andere voorspellers in het model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe wordt de proportie verklaarde variantie (R²) berekend in multipele regressie-analyse en wat vertegenwoordigt het?

A

De proportie verklaarde variantie (R²) in multipele regressie-analyse wordt berekend als het kwadraat van de multipele correlatie (R), die de correlatie tussen de beste voorspelling van de afhankelijke variabele (^y) en de geobserveerde waarden van de afhankelijke variabele (y) vertegenwoordigt. Het wordt berekend met de formule:
R^2=r^2 ^y,y

waarbij ^y,y

de correlatiecoëfficiënt is tussen de voorspelde waarden en de geobserveerde waarden van de afhankelijke variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hoe wordt de multipele correlatie (R) berekend en wat vertegenwoordigt het?

A

De multipele correlatie (R) is de correlatie tussen de voorspelde waarden van de afhankelijke variabele (^y) en de geobserveerde waarden van de afhankelijke variabele (y). Het wordt berekend door de correlatiecoëfficiënt te berekenen tussen deze voorspelde en geobserveerde waarden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is de relatie tussen R en R² in multipele regressie-analyse?

A

De proportie verklaarde variantie (R²) in multipele regressie-analyse is het kwadraat van de multipele correlatie (R). Dit betekent dat de proportie verklaarde variantie het percentage van de variantie in de afhankelijke variabele vertegenwoordigt dat wordt verklaard door de voorspellers in het regressiemodel.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is de steekproevenverdeling van de parameters in het regressiemodel en hoe wordt deze vaak weergegeven?

A

De steekproevenverdeling van de parameters in het regressiemodel (b0,b1,b2,bn) is de
t-verdeling. Deze verdeling wordt vaak gebruikt om de betrouwbaarheidsintervallen en hypothesetoetsen voor de regressiecoëfficiënten uit te voeren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hoe wordt de steekproevenverdeling van de proportie verklaarde variantie (R2 ) vaak benaderd en waarom?

A

De steekproevenverdeling van de proportie verklaarde variantie (R2) is niet eenvoudig met de hand te berekenen. Vaak wordt echter de
F-verdeling gebruikt om de
p-waarde te berekenen die aangeeft hoe waarschijnlijk het is om de gevonden
R2 te verkrijgen als er geen verband is tussen de voorspellers en de afhankelijke variabele in de populatie. Dit wordt gedaan in het kader van nulhypothesesignificantietoetsing (NHST).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

24.5
Voorbeeld lezen!!!

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat zijn de aannames van multipele regressie-analyse?

A

De aannames van multipele regressie-analyse zijn vergelijkbaar met die van enkelvoudige regressie-analyse, met de toevoeging van de zachte aanname dat er geen multicollineariteit mag zijn tussen de voorspellers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is multicollineariteit en welke gevolgen heeft het voor een regressiemodel?

A

Multicollineariteit verwijst naar het scenario waarin de voorspellers goed voorspelbaar zijn uit elkaar. Het resulteert in minder informatie beschikbaar in het regressiemodel, wat zich vertaalt naar grotere standaardfouten en bredere betrouwbaarheidsintervallen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hoe kan multicollineariteit worden opgelost?

A

Multicollineariteit kan worden opgelost door meer deelnemers te werven, wat vereist dat men van tevoren verwachtingen heeft over de samenhang tussen de voorspellers. De effectieve steekproefomvang kan worden berekend door de oorspronkelijke steekproefomvang te vermenigvuldigen met 1-r2

17
Q

Wat zijn de mogelijke gevolgen van het negeren van multicollineariteit in een regressie-analyse?

A

Het negeren van multicollineariteit kan resulteren in onnauwkeurige schattingen en onvoldoende power in vergelijking met het onderzoeksvoorstel. Dit kan leiden tot onbetrouwbare conclusies en ethische kwesties met betrekking tot de vereiste steekproefomvang.

18
Q

Hoe kan multicollineariteit worden onderzocht in een dataset?

A

Multicollineariteit kan worden onderzocht door statistische technieken zoals de variantie-inflatiefactor (VIF) en tolerantie te gebruiken. Deze twee zijn elkaars reciproke en geven inzicht in de mate van multicollineariteit in de dataset.

19
Q

Wat gebeurt er als voorspellers in een multivariate analyse met elkaar correleren?

A

Wanneer voorspellers in een multivariate analyse met elkaar correleren, kan dit te wijten zijn aan het feit dat ze constructen vertegenwoordigen die conceptueel overlappen, wat kan leiden tot problemen bij het verklaren van de afhankelijke variabele.

20
Q

Wat is het probleem met overlappende voorspellers in een multipele regressie-analyse?

A

In een multipele regressie-analyse kan het probleem van overlappende voorspellers optreden omdat de verklaarde variantie in de afhankelijke variabele tegelijkertijd bij beide voorspellers hoort, waardoor de interpretatie van de regressiecoëfficiënten problematisch wordt.

21
Q

Hoe kunnen overlappende voorspellers worden geïdentificeerd?

A

Overlappende voorspellers kunnen worden geïdentificeerd door te controleren of de definities van de constructen, de operationalisaties en de items in de meetinstrumenten niet dezelfde aspecten van de menselijke psychologie afdekken.

22
Q

Waarom zijn bivariate analyses soms meer geschikt dan multivariate analyses bij overlappende voorspellers?

A

Bij overlappende voorspellers kunnen bivariate analyses, zoals correlaties, soms meer geschikt zijn dan multivariate analyses, omdat multivariate analyses problemen kunnen veroorzaken bij het interpreteren van de resultaten vanwege de overlappende variantie in de voorspellers.

23
Q

Hoe worden dichotome voorspellers vaak gerepresenteerd in regressie-analyse?

A

Dichotome voorspellers, die slechts twee mogelijke meetwaarden hebben, worden vaak gerepresenteerd door de ene meetwaarde als 0 en de andere als 1, waardoor ze als intervalvariabelen worden beschouwd.

24
Q

Wat is het belang van het coderen van dichotome variabelen in regressie-analyse?

A

Bij het coderen van dichotome variabelen in regressie-analyse is het belangrijk om consistentie te behouden, omdat het uitmaakt welke categorie als 0 en welke als 1 wordt gecodeerd om juiste interpretaties van de parameters te verkrijgen.

25
Hoe worden voorspellers met meer categorieën vaak gerepresenteerd in regressie-analyse?
Voorspellers met meer categorieën worden vaak gerepresenteerd door dummyvariabelen, waarbij één referentiecategorie wordt gekozen en de overige categorieën elk een eigen dummy krijgen met een codering van -1/m en 1-1/m, waarbij m het totale aantal categorieën i
26
Wat is dummycodering en waarom is het belangrijk in regressie-analyse?
Dummycodering is het numeriek representeren van niet-numerieke data, vaak gebruikt om categorische variabelen op te nemen in regressie-analyse. Het is belangrijk omdat het helpt bij het interpreteren van de parameters en het vermijden van coderingsbias.
27
Wat zijn de vier veelvoorkomende situaties waarin multipele regressie-analyse wordt gebruikt?
De vier veelvoorkomende situaties zijn: 1) Pragmatische situatie waarin het doel is om simpelweg de best mogelijke voorspelling van een variabele te hebben; 2) Toegepaste situatie waarin men wil schatten hoeveel van een variabele begrepen wordt aan de hand van een serie voorspellers; 3) Situatie waarin men geïnteresseerd is in de unieke bijdrage van elke voorspeller en de voorspellers niet met elkaar samenhangen; 4) Situatie waarin voorspellers met elkaar samenhangen, maar niet conceptueel overlappen en hun samenhang het gevolg is van causale verbanden.
28
Waarom is de pragmatische situatie voor multipele regressie-analyse zeldzaam in de wetenschap?
De pragmatische situatie, waarin het doel is om simpelweg de best mogelijke voorspelling van een variabele te hebben, is zeldzaam in de wetenschap omdat wetenschappelijk onderzoek meestal gericht is op het begrijpen van fenomenen en niet alleen op voorspelling.
29
Wat is het belangrijkste doel van de toegepaste situatie voor multipele regressie-analyse?
Het belangrijkste doel van de toegepaste situatie is om te schatten hoeveel van een variabele begrepen wordt aan de hand van een serie voorspellers, zonder noodzakelijkerwijs geïnteresseerd te zijn in de unieke bijdrage van elke voorspeller.
30
Waarom is het interpreteren van regressiecoëfficiënten rechtstreeks mogelijk in de situatie waarin voorspellers niet met elkaar samenhangen?
In de situatie waarin voorspellers niet met elkaar samenhangen, kunnen regressiecoëfficiënten rechtstreeks worden geïnterpreteerd omdat ze dan zuivere schatters zijn van het effect van elke voorspeller, zonder interferentie van samenhang tussen voorspellers.
31
Doe verwerkingsopdracht 4.2!!!
32