Probeklausur C Flashcards

Question

Aufgabe 4.1: Eine Schulpsychologin möchte zwei Interventionsmöglichkeiten für aggressives Verhalten von Kindern (n = 30) vergleichen. Die Lehrer sollen einige Woche später den Fortschritt der Kinder beurteilen (sehr aggressiv, aggressiv, weniger aggressiv, kaum aggressiv, nicht aggressiv). Welches Testverfahren sollte angewendet werden? Gebe dazu die passende Nullhypothese an.

Answer 1

**AV = aggressives Verhalten (5-Faktorstufen-Skala: ordinalskaliert)** • **Stichprobe Unabhängig**: Zwei verschiedene Gruppen durchlaufen jeweils eine Intervention. Um den Vergleich der Interventionen bezüglich ihrer Effektivität zu ermöglichen, muss mit jeweils einer Messwiederholung gearbeitet werden, sprich vor und nach der Intervention. Bei diesen Voraussetzungen könnte der **U-Test von Mann-Whitney (für Veränderung Vorher/Nachher-Differenz)** angewendet werden. (**Nullhypothese: Es gibt keinen Unterschied in der Verteilung der Agressivitätsbewertung zwischen den Gruppen, H0: P(X1>X2) = P(X2>X1) = 0,5** (X1/X2 Aggressivitätsbewertungen aus Gruppe 1/2) • **Stichprobe Abhängig**: Gibt es keine Gruppenbildung, sondern müssen alle Kinder beide Interventionsformen durchlaufen und werden am Ende beurteilt, gibt es insgesamt mindestens zwei/ vielleicht sogar drei Messzeitpunkte (Vor- nach Intervention 1 und 2 ODER Vor und nach beiden) . Dann wäre das geeignete Testverfahren der **der Wilcoxon-Vorzeichenrangtest/Vorzeichentest für Vorher/Nachher-Vergleich**. (**Nullhypothese: Es ist keinen Unterschied der Agressivitätsbewertungen vor und nach den Interventionen, H0 Median der Differenzen = 0**

Answer 2

**AV = aggressives Verhalten (2-Faktorstufen-Skala: nominalskaliert, dichotom)** • Wenn Stichprobe **abhängig** = **McNemar-Test** • Wenn Stichprobe **unabhängig** = **𝜒2-Test**

Answer 3

Teil 1: Zwei Kinder, die jeweils unterschiedliche Intervention durchlaufen. Es werden zwei Skalen verwendet. - Unklar in diesem Szenario ist, ob ein **Vorher-Nachher-Vergleich stattfindet, um die Wirksamkeit der entsprechenden Intervention zu erfassen, oder ob nur die Nachher-Werte nach der Intervention miteinander verglichen werden sollen**. Auch ist es in einem **Fall von 2 Kindern nicht möglich, eine fundierte statistische Analyse durchzuführen**. Ein Vergleich der beiden Skalen könnte jedoch zeigen, welche Skala feinere Unterschiede zwischen den Interventionen feststellt. **Aussagen über die Effektivität der Interventionen können in diesem Fall nur in qualitativer Hinsicht getroffen werden, nicht auf qualitativer Ebene**. - Wir gehen davon aus, dass je eine Intervention pro Kind getestet wird. Die Wahl des Testverfahrens ist abhängig davon, ob eine Intervention mit der 2-Faktorstufen-Skala oder eine Intervention mit der 5-Faktorstufen-Skala erfasst wird und ob oben angesprochene Vorher/Nachher Vergleiche durchgeführt werden. Es ergeben sich folgende Antworten: **A) 5-Faktor, ordinal mit Vorher-Nachher-Vergleich (Stichproben abhängig) = Wilcoxon-Vorzeichen-Rang-Test** **B) 5 Faktor , ordinal ohne Vorher-Nachher-Vegleich (Stichproben unabhängig) = Mann-Whitney U-Test** **C) 2 Faktor, nominal/dichotom, mit Vorher-Nachher-Vergleich (Stichproben abhängig) = Mc-Neymar-Test** **D) 2 Faktor, nominal/dichotom, ohne Vorher-Nachher-Vergleich (Stichproben unabhängig) = CHI-Quadrat-Test** ——— A) **Vorher-Nachher-Vergleich** pro Kind, jedes Kind bekommt beide Interventionen, Messwiederholungen um beide Interventionen in ihrem Effekt zu erfassen, abhängige Stichprobe, nominalskaliert = **McNeymar-Test** B) Jedes Kind erhält eine der beiden Interventionen, **kein Vorher-Nachher-Vergleich**, unabhängige Stichprobe, nominalskaliert = **CHI-Quadrat-Test**

Answer 4

Die häufigste Alternative zum z-Test ist der **t-Test** (bei unbekannter Varianz oder kleinen Stichproben). Wenn die **Daten nicht normalverteilt oder ordinal skaliert sind, werden nicht-parametrische Tests wie der Mann Whitney-U-Test (unabhängige Gruppen) oder der Wilcoxon-Test (abhängige Gruppen) verwendet**. Wenn Sie **kategoriale Daten haben, wird ein Chi-Quadrat-Test** benötigt, und bei **mehr als zwei Gruppen kommt die ANOVA zum Einsatz**. 1. **t-Test** (für abhängige oder unabhängige Stichproben): Wenn die Populationsvarianz unbekannt ist. Oder wenn die Stichprobe kleiner als 30 ist. 2. **Mann-Whitney-U-Test** (nicht-parametrische Alternative zum unabhängigen t-Test): Wenn die Annahmen des t-Tests (Normalverteilung der Daten) verletzt sind. Wenn die Daten ordinal skaliert sind (keine Intervallskala). 3. **Wilcoxon-Vorzeichen-Rang-Test** (nicht-parametrische Alternative zum abhängigen t-Test): Wenn die Unterschiede zwischen gepaarten Messungen nicht normalverteilt sind. Wenn die Daten ordinalskaliert sind. 4. **Chi-Quadrat-Test** (für kategoriale Daten): Wenn die Variablen kategorial (nominal) sind, anstatt metrisch oder ordinal. 5. **ANOVA** (Varianzanalyse) (Alternative, wenn mehr als zwei Gruppen verglichen werden): Wenn man anstelle von paarweisen Vergleichen (wie beim t-Test) mehrere Gruppen gleichzeitig testen möchte.

Answer 5

- Eine **statistisch signifikante ANOVA sagt uns lediglich, dass sich mindestens zwei Gruppen statistisch voneinander unterscheiden, aber nicht, welche**. Um **Untschiede zu lokalisieren** gibt es zwei verschiedene Möglichkeiten: post-hoc Tests und Kontraste. - Grundsätzlich können **orthogonale (unabhängige) und non-orthogonale (abhängige) Kontraste** definiert werden. - Geplante Kontraste erlauben **spezifische Vergleiche zwischen Gruppen**, anstatt nur die statistische Signifikanz des Gesamtunterschieds zwischen allen Gruppen oder Behandlungen zu überprüfen.

Answer 6

- Ein Beispiel: Angenommen, ein Wissenschaftler führt ein **Experiment durch, um die Wirksamkeit von drei verschiedenen Diäten (Diät A, Diät B und Diät C) auf Gewichtsverlust** zu untersuchen. Er plant geplante Kontraste, um folgende Hypothesen zu überprüfen: 1. Diät A ist wirksamer als Diät B 2. Diät C ist wirksamer als Diät B 3. Diät A ist wirksamer als Diät C - Er würde dann die **Mittelwerte der drei Diätgruppen vergleichen und die statistische Signifikanz der Unterschiede berechnen**. - So kann er auf spezifischen Hypothesen über die Unterschiede zwischen den Diäten eingehen.

Answer 7

Vorgehen: Entweder wird die Validierung bei zwei natürlich vorliegenden Stichproben verwendet oder eine Stichprobe wird künstlich in zwei Teilstichproben unterteilt und dann durchgeführt 1. Eine **Regressionsgleichung wird anhand der Daten der ersten Stichprobe berechnet** 2. Die in der ersten Stichprobe **ermittele Regressionsgleichung wird angewendet, um die Werte der zweiten Stichprobe vorherzusagen**. 3. Der **geschätzte Wert wird mit dem wahren Kriteriumswert in der zweiten Stichprobe verglichen**. Da vermutlich die Korrelationskoeffizienten der beiden Stichproben nicht identisch sind gilt: sind beide Korrelationskoeffizienten sehr ähnlich, kann die Regressionsgleichung als valide gelten 4. Eine vollständige Kreuzvalidierung erfordert, dass diese **drei Schritte noch einmal „über Kreuz“ durchgeführt werden**, d.h., dass umgekehrt von der zweiten Stichprobe auf die erste Stichprobe geschlossen wird. 5. Das Ergebnis einer vollständigen Kreuzvalidierung sind somit **zwei Regressionsgleichungen**.

Answer 8

Diese Methoden stehen in direktem Zusammenhang, da ein **lineares Modell oft in einer Regressionsanalyse verwendet wird, um die lineare Beziehung zwischen den Variablen zu schätzen und die Varianzanalyse oft verwendet wird, um die Stärke dieser Beziehung zu überprüfen**. - Ein **lineares Modell ist ein Modell, das lineare Beziehungen zwischen den Variablen beschreibt**. - Die **Regressionsanalyse ist eine statistische Methode, die verwendet wird, um die lineare Beziehung zwischen einer abhängigen und unabhängigen Variablen zu schätzen** und zu überprüfen. - Die **Varianzanalyse ist eine statistische Methode, die verwendet wird, um zu untersuchen, wie viel der Variabilität in einer abhängigen Variablen durch die unabhängigen Variablen erklärt** wird.

Answer 9

Fragestellung: Gibt es Unterschiede in der Selbstwertsteigerung je nach Interventionsprogramm (A, B, C)? Variiert der Effekt je nach Geschlecht (männlich/weiblich)? **1. Ist der F-Wert signifikant (p < 0.05)?** - Prüfe, ob der F-Wert für jeden Faktor (und die Interaktion) einen p < 0.05 hat. - p < 0.05 Der Unterschied zwischen den Gruppen ist signifikant - p > 0.05 Kein signifikanter Unterschied **2. Wie groß ist die Effektstärke (n2)?** - Beurteile die praktische Relevanz des Effekts: • Kleiner Effekt: n2 = 0.01 • Mittlerer Effekt: n2 = 0.06 • Großer Effekt: n2 = 0.14 • Beispiel: n2 = 0.30 bedeutet, dass 30 % der Varianz durch den Faktor erklärt werden. **3. Haupteffekt Faktor A: Programm** - F(2,96) = 20.21, p < 0.001, n2 = 0.30 - Die drei Programme haben einen signifikanten Einfluss auf die Selbstwertsteigerung. (p < 0.001 signifikanter Unterschied, n2 = 0.30 also 30% erklärte Varianz durch den Faktor Programm) **4. Haupteffekt Faktor B: Geschlecht** - F(1,96) = 1,42, p= 0.24, n2 = 0.10 - Geschlecht hat keinen signifikanten Einfluss. (p = 0.24 kein signifikanter Unterschied, n2 = 0.24 also 24% erklärte Varianz durch den Faktor Geschlecht) **5. Interaktion: Programm × Geschlecht** - F(2,96) = 5.12, p = 0.008, n2 = 0.02 - Die Effektivität der Programme hängt vom Geschlecht ab. (p = 0.008 signifikanter Unterschied, n2 = 0.02 also 2% erklärte Varianz durch den Interaktionseffekt)

Probeklausur C Flashcards

(33 cards)