T4 Regressie-analyse, T4.1 Enkelvoudige regressie-analyse Flashcards
(71 cards)
Wat is het doel van regressieanalyse?
Het doel van regressieanalyse is om op basis van de waarde op de ene variabele een voorspelde waarde op de andere variabele te berekenen en tegelijkertijd een indruk te geven van hoe accuraat die voorspelling zal zijn.
Wat is een regressielijn en wat vertegenwoordigt het?
Een regressielijn geeft de beste voorspelling weer van de ene variabele door de andere variabele. Het vertegenwoordigt de lijn die gemiddeld voor alle punten het “dichtst” in de buurt ligt van de daadwerkelijk geobserveerde waarden van de afhankelijke variabele.
Wat zijn de twee belangrijkste vragen bij regressieanalyse?
De twee belangrijkste vragen bij regressieanalyse zijn: hoe vinden we de beste lijn in een willekeurige puntenwolk, en hoe goed past deze lijn bij de data?
Hoe worden regressielijnen beïnvloed door de steilheid en richting?
De steilheid en richting van regressielijnen worden beïnvloed door de mate van correlatie tussen de variabelen. Een steilere lijn duidt op een sterker verband tussen de variabelen, terwijl de richting aangeeft of het verband positief of negatief is.
Hoe wordt de beste voorspelling berekend met behulp van een regressielijn?
De beste voorspelling wordt berekend door het kruispunt van de regressielijn met de verticale lijn die over de bekende waarde van de onafhankelijke variabele loopt. Dit geeft de voorspelde waarde van de afhankelijke variabele.
Wat vertegenwoordigt het intercept in een regressiemodel?
Het intercept in een regressiemodel vertegenwoordigt de voorspelde waarde van de afhankelijke variabele wanneer de waarde van de onafhankelijke variabele(n) gelijk is aan nul.
Wat is extrapolatie en interpolatie in de context van regressieanalyse?
Extrapolatie is het berekenen van voorspellingen voor waarden buiten het bereik van de data waarop het regressiemodel gebaseerd is, zoals het voorspellen van een waarde bij een predictorvariabele die buiten het bereik van de oorspronkelijke data ligt. Interpolatie daarentegen is het gebruik van een model om tussenliggende waarden te berekenen binnen het bereik van de oorspronkelijke data.
Waarom kan het voorspelde gewicht van een pinguïn negatief zijn volgens het regressiemodel?
Het voorspelde gewicht van een pinguïn kan negatief zijn volgens het regressiemodel vanwege extrapolatie, waarbij de regressielijn wordt doorgetrokken tot de waarde 0 op de x-as, hoewel dit niet fysiek mogelijk is. Echter, dit heeft geen praktische relevantie omdat het model alleen wordt gebruikt voor bestaande pinguïns waarvoor extrapolatie niet nodig is.
Wat wordt bedoeld met de intercepten van een regressiemodel?
De intercepten van een regressiemodel zijn de waarden van de afhankelijke variabele wanneer alle onafhankelijke variabelen gelijk zijn aan nul. Deze waarden worden aangeduid als de intercepten en zijn de eerste regressiecoëfficiënten in het model, aangeduid als β0, B0 of b0.
Wat vertegenwoordigt de hellingscoëfficiënt in een regressiemodel?
De hellingscoëfficiënt (β1) in een regressiemodel geeft aan hoeveel de afhankelijke variabele op de y-as verandert als de onafhankelijke variabele op de x-as met één eenheid toeneemt.
Hoe wordt de helling van de regressielijn geïllustreerd?
De helling van de regressielijn wordt geïllustreerd door de groei van de variabele op de y-as als de variabele op de x-as met één eenheid toeneemt. Dit wordt weergegeven door het verschil tussen het voorspelde gewicht (of de voorspelde snavelhoogte) en het intercept.
Hoe wordt de formule voor het voorspellen van de afhankelijke variabele uit de onafhankelijke variabele(n) in een regressiemodel opgesteld?
De formule voor het voorspellen van de afhankelijke variabele uit de onafhankelijke variabele(n) in een regressiemodel is ^y = β0 + β1x1, waarbij ^y de voorspelde waarde van de afhankelijke variabele is, β0 het intercept is, β1 de hellingscoëfficiënt is en x1 de waarde van de onafhankelijke variabele.
Hoe wordt de helling van de regressielijn berekend in een regressiemodel?
De helling van de regressielijn wordt berekend als de toename of afname van de afhankelijke variabele op de y-as voor elke toename van één eenheid van de onafhankelijke variabele op de x-as. In formules wordt dit weergegeven als de waarde van de hellingscoëfficiënt (β1) in het regressiemodel.
Wat is een dichotome voorspeller in regressieanalyse?
Een dichotome voorspeller is een variabele die slechts twee waarden kan aannemen, zoals ja/nee, man/vrouw, etc.
Wat is dummycodering en waarom wordt het gebruikt bij dichotome voorspellers in regressieanalyse?
Dummycodering is het toekennen van numerieke waarden aan de categorieën van een dichotome voorspeller, meestal 0 en 1. Het wordt gebruikt om categorische variabelen met slechts twee categorieën in regressieanalyse te kunnen gebruiken.
Hoe worden de regressiecoëfficiënten geïnterpreteerd bij een dichotome voorspeller in regressieanalyse?
Bij een dichotome voorspeller in regressieanalyse is het intercept gelijk aan de voorspelde waarde voor de groep met de waarde 0 van de dichotome voorspeller. De helling van de regressielijn is het verschil tussen de gemiddelde waarden van de afhankelijke variabele voor de twee categorieën van de dichotome voorspeller.
Hoe wordt de helling van de regressielijn berekend voor een dichotome voorspeller in regressieanalyse?
De helling van de regressielijn voor een dichotome voorspeller in regressieanalyse wordt berekend als het verschil tussen de gemiddelde waarden van de afhankelijke variabele voor de twee categorieën van de dichotome voorspeller.
Welke statistische methode wordt vaak gebruikt voor het analyseren van het verband tussen een dichotome voorspeller en een continue variabele, in plaats van regressieanalyse?
Voor het analyseren van het verband tussen een dichotome voorspeller en een continue variabele wordt vaak de variantieanalyse (ANOVA) gebruikt in plaats van regressieanalyse.
Wat is het verschil tussen correlatieanalyse en regressieanalyse?
Correlatieanalyse onderzoekt de relatie tussen twee variabelen zonder een causaal verband aan te geven, terwijl regressieanalyse asymmetrisch is en een voorspellingsmodel produceert waarbij de waarde van de ene variabele wordt voorspeld op basis van de waarde van de andere variabele.
Wat is het verschil tussen de predictorvariabele en de afhankelijke variabele in regressieanalyse?
De predictorvariabele (vaak aangeduid als
�
x) is de variabele die wordt gebruikt om de waarde van de afhankelijke variabele (vaak aangeduid als
�
y) te voorspellen. De afhankelijke variabele is de variabele die wordt voorspeld op basis van de predictorvariabele.
Wat is het statistische structurele model bij enkelvoudige regressieanalyse?
Het statistische structurele model bij enkelvoudige regressieanalyse bestaat uit twee variabelen: de predictorvariabele
�
x en de afhankelijke variabele
�
y. Dit wordt weergegeven door een ellips met label
�
x aan de linkerkant en een ellips met label
�
y aan de rechterkant, met een pijl die van de linker naar de rechter ellips loopt om het causale verband aan te geven.
Wat is de proportie verklaarde variantie in regressieanalyse en hoe wordt deze aangeduid?
De proportie verklaarde variantie, aangeduid als R^2
, geeft aan hoeveel van de variantie van de afhankelijke variabele wordt verklaard door de predictorvariabele(s) in het regressiemodel. Het kan waarden aannemen van 0 tot en met 1, waarbij hogere waarden aangeven dat een groter deel van de variantie wordt verklaard.
Wat betekent een R^2 van 1 in regressieanalyse?
Een R^2 van 1 betekent dat alle geobserveerde scores exact op een rechte lijn liggen en dat de afhankelijke variabele perfect voorspeld kan worden uit de predictorvariabele(s). Met andere woorden, de predictorvariabele verklaart 100% van de variantie in de afhankelijke variabele.
Hoe wordt de R^2 berekend in enkelvoudige regressieanalyse?
In enkelvoudige regressieanalyse is de R^2
gelijk aan het kwadraat van de correlatie tussen de predictor- en de afhankelijke variabele. Dit geeft aan welk deel van de variantie in de afhankelijke variabele wordt verklaard door de predictorvariabele.