T4.3 Logistische regressie-analyse Flashcards
(36 cards)
Waarom werkt lineaire regressie niet goed voor het voorspellen van dichotome variabelen?
Lineaire regressie is gebaseerd op continue uitkomsten en is niet geschikt voor het modelleren van kansverhoudingen, wat nodig is voor dichotome variabelen.
Wat is het logistisch regressiemodel en waar wordt het voor gebruikt?
Het logistisch regressiemodel wordt gebruikt voor het voorspellen van de kans op een dichotome uitkomst op basis van één of meerdere onafhankelijke variabelen.
Wat is de odds-ratio bij logistische regressie?
De odds-ratio bij logistische regressie is een maat voor de sterkte van de associatie tussen de onafhankelijke en afhankelijke variabelen, en geeft aan hoeveel keer meer kans er is op de uitkomst bij een eenheidstoename van de onafhankelijke variabele.
Hoe wordt de kwaliteit van een logistisch regressiemodel beoordeeld?
De kwaliteit van het model wordt beoordeeld aan de hand van statistieken zoals deviance, R-squared en Akaike-informatiecriterium (AIC), die aangeven hoe goed het model de data past en generaliseert naar nieuwe data.
Wat zijn enkele aannames bij logistische regressie?
Aannames bij logistische regressie omvatten onder andere afwezigheid van multicollineariteit tussen onafhankelijke variabelen, lineaire relatie tussen de logaritme van de kansverhouding en onafhankelijke variabelen, en afwezigheid van outliers en influential points.
Hoe verhouden de te volgen stappen bij het analyseren van een model met logistische regressie zich tot die van lineaire regressie?
De te volgen stappen zijn vergelijkbaar met die bij lineaire regressieanalyse, maar de onderliggende rekenmethode verschilt en vereist specifieke interpretatie van de uitkomsten.
Waarom werkt lineaire regressie niet goed voor het voorspellen van dichotome variabelen?
Lineaire regressie werkt niet goed voor het voorspellen van dichotome variabelen omdat het probeert een rechte lijn te passen aan data die alleen bestaat uit ‘geslaagd’ of ‘gezakt’, wat resulteert in voorspellingen buiten het bereik van 0 tot 1.
Hoe lost logistische regressie het probleem op dat lineaire regressie ondervindt bij dichotome variabelen?
Logistische regressie gebruikt een S-curve om de kans op een bepaalde uitkomst (bijvoorbeeld ‘geslaagd’) te modelleren, waarbij de curve een platte bodem heeft bij 0 en een plat plafond bij 1, waardoor het geschikt is voor dichotome variabelen.
Wat is de rol van de logistische curve in logistische regressie?
De logistische curve geeft de kans op een specifieke uitkomst weer (zoals ‘geslaagd’), waarbij de kans tussen 0 en 1 ligt, wat geschikt is voor dichotome variabelen.
Hoe verschillen de regressievergelijkingen van logistische regressie van die van lineaire regressie?
De regressievergelijkingen van logistische regressie zijn complexer dan die van lineaire regressie omdat logistische regressie geen lineaire functies gebruikt, wat resulteert in een andere output en het gebruik van andere termen dan bij lineaire regressie.
Wat is het doel van het logistische regressiemodel?
Het logistische regressiemodel wordt gebruikt om kansen te voorspellen in plaats van enkel binair (0 of 1) te voorspellen, waardoor meer flexibiliteit wordt geboden.
Wat is de logistische transformatie en waarom wordt deze gebruikt?
De logistische transformatie wordt gegeven door de formule ¯y = log(p/(1−p)). Het wordt gebruikt om de kans (p) te transformeren naar log-odds, wat geschikt is voor een lineair model in logistische regressie.
Hoe wordt de regressievergelijking van een logistisch model met twee predictoren weergegeven?
De regressievergelijking wordt weergegeven als log(p/(1−p)) = ^y = a + b1x1 + b2x2 + ϵ, waarbij x1 en x2 predictoren zijn, b1 en b2 de regressiecoëfficiënten zijn, a het intercept is, en ϵ de random error of het residu aangeeft.
Hoe kan de voorspelde log-odds worden omgezet naar een kans op succes?
De voorspelde log-odds worden omgezet naar een kans op succes met de formule p = exp(^y) / (1 + exp(^y)), waarbij exp verwijst naar de exponentiële functie.
Wat is het verschil tussen kansen en odds?
Kansen zijn een verhouding van een mogelijke uitkomst met het totaal van alle mogelijkheden, terwijl odds een verhoudingsmaat zijn tussen een gebeurtenis en de overige gebeurtenissen.
Hoe wordt de odds-ratio uitgedrukt in de output van een logistische regressie?
De odds-ratio wordt weergegeven als een verhouding en kan op twee manieren worden uitgedrukt: bijvoorbeeld als 1/12 of als 12/1, waarbij beide getallen vrijwel hetzelfde betekenen, maar anders worden gelezen afhankelijk van of ze hoger of lager zijn dan 1.
Waarom is de interpretatie van regressiecoëfficiënten in het logistische model complexer dan bij gewone multiple regressie?
: In het logistische model betekent een stijging in x1 dat de log-odds met b1 stijgen, wat moeilijk te interpreteren is. Daarom wordt meestal alleen gekeken of de parameter b significant is en of deze de log-odds doet stijgen (b > 0) of dalen (b < 0).
Hoe wordt de exponent van de regressiecoëfficiënten meestal weergegeven in de output van een logistische regressieanalyse?
De exponent van de coëfficiënten (exp(b)) wordt berekend en standaard weergegeven in de output van een logistische regressieanalyse.
Wat wordt bedoeld met de odds-ratio in het kader van logistische regressie?
De odds-ratio is een verhouding tussen twee odds. Een odds-ratio groter dan 1 (b > 0, dus exp(b) > 1) duidt op een toename van de odds, terwijl een odds-ratio tussen 0 en 1 (b < 0, dus exp(b) < 1) een afname aangeeft.
Hoe wordt de odds-ratio berekend en geïnterpreteerd?
De odds-ratio wordt berekend als exp(b) en geeft aan hoe de kansverhouding (odds) verandert wanneer de bijbehorende x met één eenheid stijgt. Als exp(b) > 1, neemt de kansverhouding toe, en als exp(b) < 1, neemt deze af.
Wat betekent een exponent van de coëfficiënten (exp(b)) van meer dan 1?
Een exp(b) van meer dan 1 betekent dat de kansverhouding (odds) toeneemt wanneer de bijbehorende x met één eenheid stijgt.
Wat is het doel van het voorbeeld van schoolsucces met betrekking tot logistische regressie?
Het doel is om te voorspellen of iemand slaagt op basis van zijn IQ-score met behulp van logistische regressie en om de interpretatie van de resultaten te begrijpen.
Hoe wordt het logistische regressiemodel geformuleerd voor het voorbeeld van schoolsucces?
: Het model is log(p(uitslag=1)/(1−p(uitslag=1)))=a+b1IQ, waarbij IQ de predictor is en uitslag de afhankelijke variabele, met coëfficiënten a en b1.
Wat wordt bedoeld met de log-odds in de context van het voorbeeld van schoolsucces?
De log-odds geeft de logaritme van de kansverhouding van het slagen versus niet slagen op basis van de IQ-score.