Einfache lineare Regression Flashcards Preview

Methoden empirische Sozialforschung > Einfache lineare Regression > Flashcards

Flashcards in Einfache lineare Regression Deck (10):
1

Was besagt die einfache lineare Regressionsanalyse

beschreibt die Art des Zusammenhangs (nicht die Stärke)

2

welches Ziel verfolgt die einfache lineare Regressionsanalyse?

eine Ausprägung der Variable y (Kriterium) durch eine andere x (Prädiktor) vorherhzusagen

unterschiedlicher Stellenwert der Variablen, da Festlegung von Kriterium und Prädiktor

3

Welche Voraussetzungen müssen für eine einfache lineare Regression erfüllt sein?

Intervallskalierung

Bivariate Normalverteilung von x und y (Dichtefunktion!)

Homoskedastizität

Unabhängigkeit und Normalverteilung der Residuen

4

Warum wird sie in den Sozialwissenschaften benutzt?

weil nicht ein deterministischer, sondern ein stochastischer Zusammenhang relevant ist ( = nicht exakte Vorhersage, sondern geringster Fehler)

5

Wie geht man dabei vor?

Ermittlung einer Regressionsgeraden mit geringstem Vorhersagefehler (=Differenz zw. tats. und erwart. Werten)
y^= b(yx)x + a(yx)
--> Methode der kleinsten Quadrate (= Summe der quadr. Abweichungen ist minimal)

b(yx) = Regressionsgewicht: Maß für Einfluss der Variable (um wie viel der Wert y steigt, wenn x sich um eine Einheit erhöht)

a(yx) = y-Achsenabschnitt = Interzept

6

wie ist die Güte der Vorhersage zu bewerten?

keine exakte Vorhersage, sondern kleinster Fehler
--> Ausmaß abhängig von Höhe der Korrelation
--> StandardSCHÄTZfehler zur Berechnung der Fehler

7

Was besagt der Standardschätzfehler s(e)

Maß für die Ungenauigkeit der Vorhersage (je kleiner, desto genauer)

wie stark beobachtete Werte um vorhergesagte Werte streuen (Abstand = Residuen)

8

Was ist die Gesamtvarianz?

Maß für Unterschiede im Kriterium

setzt sich zusammen aus Regressionsvarianz und Residualvarianz

y(i) - y(quer) = Residualvarianz + Regressionsvarianz

y(i) - y(quer) = (y(i) - y^) + (y^- yquer) --> Varianzzerlegung

9

Was ist die Regressionsvarianz?

Anteil der durch die Regression aufgeklärt wird

Maß für die Güte ist der Anteil der RV an GV (großer Anteil: Prädiktor ist bedeutsam)

10

Was ist der Determinationskoeffizient r²?

Anteil der Regressionsvarianz an der Gesamtvarianz

Anteil von y, der durch x aufgeklärt werden kann (wie genau/bedeutsam y durch x vorhergesagt werden kann)