4 Hierarchische Lineare Modelle Flashcards

(40 cards)

1
Q

Was sind hierarchische (genestete) Datenstrukturen?

A
  • Daten, bei denen Einheiten auf verschiedenen ebenen organisiert sind. z.B. Schulen (Level3) - Klassen (Level2) - Individuuen (Level1)
  • Daten von wiederholter Messung

Schülerinnen innerhalb derselben Klasse ähneln sich oft mehr (z. B. durch den gleichen Lehrer, Unterrichtsstil etc.) als Schülerinnen aus verschiedenen Klassen. Datenpunkte sind also nicht unabhängig – das ist der Grund, warum wir bei solchen Strukturen spezielle Verfahren wie hierarchische lineare Modelle (HLM) oder multilevel models verwenden. Das gleiche gilt bei wiederholter Messung der gleichen Personen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist der Simpson-Paradox?

A

Beim Simpson-Paradox kehrt sich ein Zusammenhang zwischen zwei Variablen um, wenn man die Daten aufteilt oder gruppiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist ein ökologisher Fehlschluss?

A

Ein ökologischer Fehlschluss passiert, wenn man von Zusammenhängen auf Gruppenebene fälschlicherweise auf Individuen schliesst.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind statistische Fehlentscheidungen?

A

Wenn der Zusammenhang zwar korrekt ist, aber man zu schnell davon ausgeht, dass der Zusammenhang signifikant ist (=Standardfehler unterschätzt, Risiko für statistische Fehlentscheidungen erhöht).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welches Problem entsteht durch hierarchische Datenstrukturen?

A

Die Unabhängigkeitsannahme der klassischen Regression wird verletzt, das heisst, es können falsche Zusammenhangsinterpretationen und statistische Fehlentscheidungen erfolgen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welche Möglichkeiten haben wir bei genesteten (hierarchischen) Datenstrukturen?

A
  • Hierarchisch Lineare Modelle (gut, aber eher kompliziert)
  • Variablen, die zu systematischen Unterschieden zwischen den Levels führen, in die Regression aufnehmen (aber, häufig viele Variablen, nicht alle bestimmbar)
  • Zugehörigkeiten zu Level-2-Variablen direkt mit Codiervariablen abbilden (jedochc nur bei wenigen Gruppen, z.B. 3)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ab wie vielen Level-2 Einheiten machen hierarchisch-lineare Modelle sinn?

A

Ab ca. 20

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wie hängen Ähnlichkeiten innerhalb und zwischen Level-2 Einheiten zusammen?

A

Je grösser der Anteil der Level-2-Varianz an der Gesamtvarianz ist, desto grösser sind die Ähnlichkeiten innerhalb im Vergleich zu zwischen den Level-2-Einheiten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist Intraklassenkorrelation (ICC)? Wann ist sie hoch, wann tief?

A

Wie stark hängen die Werte innerhalb derselben Gruppe zusammen – verglichen mit Werten zwischen verschiedenen Gruppen?

hoch: Wenn SuS innerhalb derselben Klasse sehr ähnliche Leistungen haben (damit haben sie über die Klassen hinweg oft unterschiedliche Leistungen)

tief: Wenn SuS innerhalb derselben Klasse unterschiedliche Leistungen haben, über die Klassen hinweg gesehen aber ähnliche.

-> Ist die ICC hoch, hat die Gruppenzugehörigkeit einen grossen Einfluss auf die unterschiede, ist sie tief, hat sie wenig Einfluss.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welche hierarchisch linearen Modelle werden in der LV angeschaut?

A

Modelle mit Level-1 Effekten
* Intercept-Only-Modell
* Random-Intercept-Modell
* Random-Coefficients-Modell

Modelle mit festen Level-1 Effekten und Level-2 Effekten
* Modell mit Level-2-Prädiktoren

Modelle mit Cross-Level-Interatkeion
* Modell mit Cross-Level-Interaktion

Repeated-Measures-Modelle
* Modelle der Veränderungsmessung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist das Intercept-Only-Modell?

A
  • Einfachstes Modell
  • Keine Prädikatoren
  • Nur Interzept (Durchschnittswert)

-> dann wir die Varianz in Varianz zwischen Gruppen (Level-2-Moodell) und Varianz innerhalb der Gruppen (Level-1-Modell) zerlegt -> araus das ICC berechnet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Unterschied zwischen dem Intercept-only und dem Nullmodell?

A

Beim Nullmodell gibt es nur einen gemeinsamen Mittelwert, das Intercept-Only-Modell gibt es einen eigenen Mittelwert pro Gruppe. (Bild: Schwarze Linie wäre Nullmodell, farbige Linien wären Intercept-Only-Modell) (Die Steigung wird komplett ignoriert)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist das Random-Intercept-Modell?

A

In diesem Modell gibt es ebenfalls eigene Mittelwerte für jede Gruppe, jedoch bleibt die steigung (Achse y) überall gleich. D.h. die Prädikatoren sind überall gleich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist das Random-Coefficients-Modell?

A

Ein Modell, in dem sowohl Intercepts als auch Steigungen zwischen Gruppen variieren können.

-> Linien sind nicht mehr parallel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Warum brauchen wir beim Random-Coefficients-Modell eine Varianz-Kovarianz-Matrix?

A

Wir wollen wissen:
- Wie stark schwanken die zufälligen Effekte auf Level-2 (Random Interepts, Random Slopes)
- Wie hängen die Effekte zusammen?
Das wird durch die Varianz-Kovarianz-Matrix möglich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Welche Fragen beantwortet die Varianz-Kovarianz-Matrix?

A
  • Wie stark der Intercept zwischen Gruppen streut (= Varianz der Intercepts)
  • Wie stark die Steigung zwischen Gruppen streut (= Varianz der Steigungen)
  • Ob Gruppen mit einem höheren Intercept auch eine höhere Steigung haben (oder eine tiefere – je nach Richtung)(Kovarianz).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was bedeutet die Kovarianz?

A

Positive Kovarianz:
→ Gruppen mit höherem Intercept haben auch steilere Steigungen.

Negative Kovarianz:
→ Gruppen mit höherem Intercept haben flachere (oder sogar negative) Steigungen.

Kovarianz nahe 0:
→ Intercepts und Slopes hängen nicht stark zusammen.

18
Q

Was ist ein Modell mit Level-2 Prädiktoren?

A

In einem Modell mit Level-2-Prädiktoren benutzt du Eigenschaften der Gruppen (nicht der einzelnen Personen!), um Unterschiede zwischen den Gruppen zu erklären.

19
Q

Was können Level-2-Prädiktoren sein?

A
  • Anzahl der SuS
  • Anteil der älteren Jugendlichen
  • Anzahl Erfahrungsjahre der Lehrperson

Level-2-Prädiktoren sind Gruppenvariablen, die die Unterschiede in den Intercepts und/oder Slopes erklären sollen.

20
Q

Was ist ein Modell mit Cross-Level-Interaktionseffekt?

A

Ein Cross-Level-Interaktionseffekt entsteht, wenn ein Prädiktor auf Level 2 (z. B. Gruppeneigenschaft) beeinflusst, wie stark ein Prädiktor auf Level 1 (Einzelebene) wirkt.

z.B. Lernstunden wirken sich stärker auf die Noten aus, wenn die Klasse klein ist und schwächer, wenn die Klasse gross ist.

21
Q

Warum braucht es bei Repeated-Measures-Modellen ebenfalls hierarchische Modelle?

A

Weil Messwerte von einer gleichen Person meist ähnlicher sind, als Messwerte von verschiedenen Personen.

22
Q

Wie verhalten sich Level-1 und Level-2 bei Repeated Measures?

A

Level-1: Messzeitpunkte
Level-2: Personen

23
Q

Was sind Trendmodelle bei der Messwiederholung?

A

Sie prüfen, ob es einen systematischen Verlauf über die Zeit gibt (z.B. linearer oder gekrümmter Anstieg oder Abfall.

-> sinnvoll, wenn es viele Messzeitpunkte gibt und man sich für die Form des Zusammenhangs zwischen Zeit und AV interessiert

-> wir beschränken uns auf Trendmodelle!!

24
Q

Was sind Kontrastmodelle bei der Messwiederholung?

A

Kontrastmodelle vergleichen gezielt bestimmte Zeitpunkte oder Bedingungen miteinander.

-> sinnvoll, wenn es wenige Messzeitpunkte gibt und sich diese qualitativ voneinander unterscheiden

25
Reicht die Signifikanz für die Angabe eines linearen Trends aus?
Nein. Siehe Bild.
26
Wie werden Modellparameter in Mehrebenenmodellen geschätzt?
Mit der Maximum-Likelihood- oder Restricted-Maximum-Likelihood-Methode (ML/REML).
27
Wie testet man die Signifikanz von Modellparametern?
Durch t-Tests der Koeffizienten oder Likelihood-Ratio-Tests für Modellvergleiche.
28
Wie bewertet man die Modellpassung?
Mit Informationskriterien wie AIC oder BIC und dem Likelihood-Ratio-Test.
29
Wozu dienen REML und ML-Modelle?
🔹 REML = Restricted (oder Residual) Maximum Likelihood 🔹 ML = Maximum Likelihood Beides sind Methoden, um die Modellparameter (also Varianzen, Intercepts, Slopes etc.) in Mixed-Models oder Mehrebenenmodellen zu schätzen.
30
Was ist die Full-Maximum Likelihood-Funktion (ML//FML)?
Schätzt alle Modellparameter gleichzeitig: Fixe Effekte (z. B. Mittelwerte, Steigungen) Zufällige Effekte (z. B. Varianzen der Intercepts und Slopes) Nutzt die gesamte Likelihood der Daten. -> Für genestete Daten Vorteil: ✅ Vergleich von Modellen mit verschiedenen fixen Effekten ist möglich (z. B. mehr Prädiktoren oder Interaktionen hinzufügen). Nachteil: ❌ Schätzt die Varianzen etwas verzerrt nach unten, besonders bei kleinen Stichproben.
31
Was ist das Restricted Maximum Likelihood Modell? REML?
Trennt die Schätzung von: Fixen Effekten (z. B. Mittelwerte, Steigungen) Zufälligen Effekten (z. B. Varianzen der Gruppen) REML zieht die geschätzten fixen Effekte vorher ab – also arbeitet sie auf Basis der Residuen. Vorteil: ✅ Unverzerrtere Schätzung der Varianzen, v. a. bei kleinen Stichproben. Nachteil: ❌ Nicht geeignet zum Vergleich von Modellen mit unterschiedlichen fixen Effekten (z. B. man kann nicht direkt testen: „Macht Prädiktor X das Modell besser?“)
32
Woran erkenne ich ein Intercept-only-Modell aus einem Jamovi-Output?
Bei den Fixed Effekts steht nur ein Intercecpt und nichts anderes.
33
Wie wäre der richtige Ablauf beim Rechnen von HLM?
1. Intercept-only-Modell rechnen, um den ICC abzulesen (mit REML) 2. Bei ICC > 0.05 und / oder Level-2-Einheiten > 20 braucht es hierarchisch lineare Modelle! 3. Inspektion der Abhängigen und unabhängigen Variablen 4. Random-Intercept-Modell (RIM) mit interessierender Level-1-Prädiktoren (ohne REML) 5. Modellvergleich IOM und RIM -> Varianzaufklärung der Level-1-Prädiktoren 6. Erweiterung testen: Random-Coefficient-Modell (RCM) (mit denselben Level-1-Prädiktoren) 7. Modellvergleich RIM und RCM 8. RIM mit interessirender Level-2-Prädiktoren (prüfen, ob ein Level-2-Prädiktor die Vorhersagekraft im Rauchverhalten verbessern könnte) 9. Modellvergleich nur Level-1-Modell zu Level-2-Modell 10. Regressionsdiagnostik (Voraussetzungen) 11. Cross-Level-Interaktion (in dem man variablen miteinander multipliziert in einer separaten spalte)
34
Was ist eine Devianz?
Die Devianz misst, wie gut ein Modell zu den Daten passt – ähnlich wie die Summe der Fehlerquadrate in linearen Modellen, aber verallgemeinert für GLMs (z. B. logistische Regression). Je kleiner die Devianz, desto besser die Modellanpassung
35
Welche Möglichkeiten gibt es, um verschiedene Modelle miteinander zu vergleichen?
* AIC * BIC * Devianz
36
Wie vergleiche ich Modelle mit AIC/BIC
Das Modell mit dem kleineren AIC oder BIC besser passt.
37
Was sind die Voraussatzungen für die Hierarchischen Linearen Modelle
- Normalverteilung - Homoskedastizität Jeweils auf Level-1 und Level-2 separat testen.
38
Was bedeutet es, wenn die Normalverteilung auf Level-2 verletzt ist?
Dann ist der statistische Test vermutlicch zu liberal
39
39
Was bedeutet "langes Format" für Datensätze für Trendmodelle?
Jede Messung einer Person steht in einer eigenen Zeile (d.h. es gibt mehrere Zeilen pro Person und eine zusätzliche Spalte, die den Messzeitpunkt angibt.)