Lineare Regression Flashcards Preview

Statistik I > Lineare Regression > Flashcards

Flashcards in Lineare Regression Deck (15)
Loading flashcards...
1

Ziel einer linearen Regression

- Vorhersage einer Variable (kriterium)
durch eine andere Variable (Praediktor)

2

Lineare Regression: Voraussetzungen

- X und Y sind intervallskaliert
- X und Y sind normalverteilt
- Homoskedastizitaet
- Residuen muessen unabhaengig und normalverteilt sein

3

Lineare Regression: Anwendungsbeispiel

- Werte von X wurden bereits erhoben, Werte von Y sind nicht bekannt
- X ist leicht, schnell zu erfassen, Y nur durch teure aufwaendige Untersuchung

4

Was sind Residuen?

die Abstaende der Werte zur Gerade

5

viele Werte nahe an der Gerade,
wenige Werte weiter weg

keine Homoskedastizitaet

6

Was beschreibt die Gerade?

den Zusammenhang zwischen X und Y
- jedes Wert von X kann ein Wert von Y vorhersagen

7

Was kann aus einer Regressionsgerade bestimmt werden

Regressionsgewicht (b)
additive Konstante (a)

- wenn Streuungen, Mittelwerte und die Korrelation bekannt sind

8

Was fuer zwei moegliche Formen der Regressionsgeraden gibt es?

- unstandardisiert
- standardisiert (Konstante = 0)

9

Was ist der Standardschaetzfehler?

- die Standardabweichung der Residuen
--> Streuung der y-Werte um die Regressionsgerade
- Mass dafuer wie stark die geschaetzten y-Werte von den tatsaechlichen y-Werten abweichen
- Guetemassstab fuer die Genauigkeit der Vorhersage

10

Welche Phaenomene muessen bei der Regression beachtet werden?

1) Regression zur Mitte
2) Restriction of Range

11

Regression zur Mitte

ein extremer Wert zu Zeitpunkt A wird sich zu Zeitpunkt B ueberzufaellig haeufig zu einem weniger extremen Wert veraendern wird

12

Regression zur Mitte: wie kann man dieses Phaenomen erklaeren?

Anhand der Normalverteilung

13

Regression zur Mitte: Problem

diese stat. Veraenderungen koennen inhaltlich interpretiert werden

14

Restriction of Range

- Variationseinschraenkung
- Streuung wird kuenstlich eingeschraenkt

15

Restriciton of Range: Problem?

Korrelation der Population wird unterschaetzt
--> Normalverteilungsannahme wird moeglicherweise verletzt