4 Hierarchische Lineare Modelle Flashcards
(40 cards)
Was sind hierarchische (genestete) Datenstrukturen?
- Daten, bei denen Einheiten auf verschiedenen ebenen organisiert sind. z.B. Schulen (Level3) - Klassen (Level2) - Individuuen (Level1)
- Daten von wiederholter Messung
Schülerinnen innerhalb derselben Klasse ähneln sich oft mehr (z. B. durch den gleichen Lehrer, Unterrichtsstil etc.) als Schülerinnen aus verschiedenen Klassen. Datenpunkte sind also nicht unabhängig – das ist der Grund, warum wir bei solchen Strukturen spezielle Verfahren wie hierarchische lineare Modelle (HLM) oder multilevel models verwenden. Das gleiche gilt bei wiederholter Messung der gleichen Personen.
Was ist der Simpson-Paradox?
Beim Simpson-Paradox kehrt sich ein Zusammenhang zwischen zwei Variablen um, wenn man die Daten aufteilt oder gruppiert.
Was ist ein ökologisher Fehlschluss?
Ein ökologischer Fehlschluss passiert, wenn man von Zusammenhängen auf Gruppenebene fälschlicherweise auf Individuen schliesst.
Was sind statistische Fehlentscheidungen?
Wenn der Zusammenhang zwar korrekt ist, aber man zu schnell davon ausgeht, dass der Zusammenhang signifikant ist (=Standardfehler unterschätzt, Risiko für statistische Fehlentscheidungen erhöht).
Welches Problem entsteht durch hierarchische Datenstrukturen?
Die Unabhängigkeitsannahme der klassischen Regression wird verletzt, das heisst, es können falsche Zusammenhangsinterpretationen und statistische Fehlentscheidungen erfolgen.
Welche Möglichkeiten haben wir bei genesteten (hierarchischen) Datenstrukturen?
- Hierarchisch Lineare Modelle (gut, aber eher kompliziert)
- Variablen, die zu systematischen Unterschieden zwischen den Levels führen, in die Regression aufnehmen (aber, häufig viele Variablen, nicht alle bestimmbar)
- Zugehörigkeiten zu Level-2-Variablen direkt mit Codiervariablen abbilden (jedochc nur bei wenigen Gruppen, z.B. 3)
Ab wie vielen Level-2 Einheiten machen hierarchisch-lineare Modelle sinn?
Ab ca. 20
Wie hängen Ähnlichkeiten innerhalb und zwischen Level-2 Einheiten zusammen?
Je grösser der Anteil der Level-2-Varianz an der Gesamtvarianz ist, desto grösser sind die Ähnlichkeiten innerhalb im Vergleich zu zwischen den Level-2-Einheiten.
Was ist Intraklassenkorrelation (ICC)? Wann ist sie hoch, wann tief?
Wie stark hängen die Werte innerhalb derselben Gruppe zusammen – verglichen mit Werten zwischen verschiedenen Gruppen?
hoch: Wenn SuS innerhalb derselben Klasse sehr ähnliche Leistungen haben (damit haben sie über die Klassen hinweg oft unterschiedliche Leistungen)
tief: Wenn SuS innerhalb derselben Klasse unterschiedliche Leistungen haben, über die Klassen hinweg gesehen aber ähnliche.
-> Ist die ICC hoch, hat die Gruppenzugehörigkeit einen grossen Einfluss auf die unterschiede, ist sie tief, hat sie wenig Einfluss.
Welche hierarchisch linearen Modelle werden in der LV angeschaut?
Modelle mit Level-1 Effekten
* Intercept-Only-Modell
* Random-Intercept-Modell
* Random-Coefficients-Modell
Modelle mit festen Level-1 Effekten und Level-2 Effekten
* Modell mit Level-2-Prädiktoren
Modelle mit Cross-Level-Interatkeion
* Modell mit Cross-Level-Interaktion
Repeated-Measures-Modelle
* Modelle der Veränderungsmessung
Was ist das Intercept-Only-Modell?
- Einfachstes Modell
- Keine Prädikatoren
- Nur Interzept (Durchschnittswert)
-> dann wir die Varianz in Varianz zwischen Gruppen (Level-2-Moodell) und Varianz innerhalb der Gruppen (Level-1-Modell) zerlegt -> araus das ICC berechnet.
Was ist der Unterschied zwischen dem Intercept-only und dem Nullmodell?
Beim Nullmodell gibt es nur einen gemeinsamen Mittelwert, das Intercept-Only-Modell gibt es einen eigenen Mittelwert pro Gruppe. (Bild: Schwarze Linie wäre Nullmodell, farbige Linien wären Intercept-Only-Modell) (Die Steigung wird komplett ignoriert)
Was ist das Random-Intercept-Modell?
In diesem Modell gibt es ebenfalls eigene Mittelwerte für jede Gruppe, jedoch bleibt die steigung (Achse y) überall gleich. D.h. die Prädikatoren sind überall gleich.
Was ist das Random-Coefficients-Modell?
Ein Modell, in dem sowohl Intercepts als auch Steigungen zwischen Gruppen variieren können.
-> Linien sind nicht mehr parallel
Warum brauchen wir beim Random-Coefficients-Modell eine Varianz-Kovarianz-Matrix?
Wir wollen wissen:
- Wie stark schwanken die zufälligen Effekte auf Level-2 (Random Interepts, Random Slopes)
- Wie hängen die Effekte zusammen?
Das wird durch die Varianz-Kovarianz-Matrix möglich.
Welche Fragen beantwortet die Varianz-Kovarianz-Matrix?
- Wie stark der Intercept zwischen Gruppen streut (= Varianz der Intercepts)
- Wie stark die Steigung zwischen Gruppen streut (= Varianz der Steigungen)
- Ob Gruppen mit einem höheren Intercept auch eine höhere Steigung haben (oder eine tiefere – je nach Richtung)(Kovarianz).
Was bedeutet die Kovarianz?
Positive Kovarianz:
→ Gruppen mit höherem Intercept haben auch steilere Steigungen.
Negative Kovarianz:
→ Gruppen mit höherem Intercept haben flachere (oder sogar negative) Steigungen.
Kovarianz nahe 0:
→ Intercepts und Slopes hängen nicht stark zusammen.
Was ist ein Modell mit Level-2 Prädiktoren?
In einem Modell mit Level-2-Prädiktoren benutzt du Eigenschaften der Gruppen (nicht der einzelnen Personen!), um Unterschiede zwischen den Gruppen zu erklären.
Was können Level-2-Prädiktoren sein?
- Anzahl der SuS
- Anteil der älteren Jugendlichen
- Anzahl Erfahrungsjahre der Lehrperson
Level-2-Prädiktoren sind Gruppenvariablen, die die Unterschiede in den Intercepts und/oder Slopes erklären sollen.
Was ist ein Modell mit Cross-Level-Interaktionseffekt?
Ein Cross-Level-Interaktionseffekt entsteht, wenn ein Prädiktor auf Level 2 (z. B. Gruppeneigenschaft) beeinflusst, wie stark ein Prädiktor auf Level 1 (Einzelebene) wirkt.
z.B. Lernstunden wirken sich stärker auf die Noten aus, wenn die Klasse klein ist und schwächer, wenn die Klasse gross ist.
Warum braucht es bei Repeated-Measures-Modellen ebenfalls hierarchische Modelle?
Weil Messwerte von einer gleichen Person meist ähnlicher sind, als Messwerte von verschiedenen Personen.
Wie verhalten sich Level-1 und Level-2 bei Repeated Measures?
Level-1: Messzeitpunkte
Level-2: Personen
Was sind Trendmodelle bei der Messwiederholung?
Sie prüfen, ob es einen systematischen Verlauf über die Zeit gibt (z.B. linearer oder gekrümmter Anstieg oder Abfall.
-> sinnvoll, wenn es viele Messzeitpunkte gibt und man sich für die Form des Zusammenhangs zwischen Zeit und AV interessiert
-> wir beschränken uns auf Trendmodelle!!
Was sind Kontrastmodelle bei der Messwiederholung?
Kontrastmodelle vergleichen gezielt bestimmte Zeitpunkte oder Bedingungen miteinander.
-> sinnvoll, wenn es wenige Messzeitpunkte gibt und sich diese qualitativ voneinander unterscheiden