Probeklausur C Flashcards
(33 cards)
Was ist eine Nullhypothese?
Eine Negativhypothese, die angibt, dass es keine Mittelwertsunterschiede oder Zusammenhänge in der Population gibt
Beispiel: H0: µ1 = µ2
Was ist eine Alternativhypothese?
Eine Positivhypothese, die besagt, dass ein Unterschied oder Zusammenhang in der Population existiert
Beispiel: H1: µ1 ≠ µ2
Was ist das Signifikanzniveau Alpha?
Das Signifikanzniveau legt fest, ab welcher α-Fehler-Wahrscheinlichkeit (p) die Nullhypothese verworfen wird
Ein typisches Signifikanzniveau ist 5 % (α = 0.05).
Was sind die zwei Arten von Stichproben?
- Abhängige Stichproben
- Unabhängige Stichproben
Abhängige Stichproben beeinflussen sich gegenseitig, während unabhängige Stichproben keine Informationen über die jeweils andere geben.
Was passiert, wenn der Stichprobenumfang zu klein ist?
Es kann die statistische Absicherung eines in der Population vorhandenen relevanten Effekts erschweren
Ein zu kleiner Stichprobenumfang kann zu einem erhöhten Risiko für ß-Fehler führen.
Wie beeinflusst eine zu große Stichprobe die Ergebnisse?
Es besteht die Gefahr, dass für die Praxis unbedeutende Effekte statistisch signifikant werden
Was geschieht bei der Entscheidung/Signifikanzprüfung?
Der ermittelte Wert wird mit einem kritischen Wert verglichen
Liegt der ermittelte Wert im Ablehnungsbereich, wird die Nullhypothese abgelehnt.
Was ist die Interpretation der Effektgröße?
Es wird untersucht, ob der Unterschied oder Zusammenhang auch von praktischer Relevanz ist
Ein kleiner Unterschied kann bei großem Stichprobenumfang statistisch signifikant sein, aber praktisch unbedeutend.
Wie kann die Teststärke einer Studie erhöht werden?
- Größerer Stichprobenumfang
- Höheres Signifikanzniveau
- Einseitige Testung
- Geringere Streuung
- Größerer statistischer Effekt
- Abhängige Stichproben
- Höheres Skalenniveau
- Erfüllung der Verteilungsannahmen
- Parametrische Tests
- Eliminierung von Störvariablen
Diese Maßnahmen helfen, die Wahrscheinlichkeit zu erhöhen, dass ein echter Effekt entdeckt wird.
Welches Testverfahren sollte bei ordinalskaliertem aggressiven Verhalten verwendet werden?
Mann-Whitney U-Test oder Mediantest
Abhängig von der Art der Stichprobe (unabhängig oder abhängig).
Was ist die häufigste Alternative zum z-Test?
t-Test
Der t-Test wird verwendet, wenn die Populationsvarianz unbekannt ist oder die Stichprobe kleiner als 30 ist.
Welche Aussage zur linearen Regression ist korrekt?
a) Eine der Voraussetzungen der linearen Regression ist es, dass keine Homokedastizität vorliegen darf.
b) Je größer die Streuung des Kriteriums, desto größer ist der Standardschätzfehler.
c) Der Standardfehler kann als die Streuung der tatsächlichen y-Werte um die Regressionsgrade aufgefasst werden.
d) Je größer Korrelation zwischen Prädiktor und Kriterium, desto kleiner ist der Standardschätzfehler.
e) Die abhängige Variable in der Regression wird auch Prädiktor genannt.
b) Der Standardfehler kann als die Streuung der tatsächlichen y-Werte um die Regressionsgrade aufgefasst werden
d) Je größer Korrelation zwischen Prädiktor und Kriterium, desto kleiner ist der Standardschätzfehler.
Die anderen Aussagen sind nicht korrekt.
Aufgabe 8: Was beschreibt die Quadratsummenzerlegung bei der zweifaktoriellen Varianzanalyse?
Zerlegung der Gesamtvarianz in vier Teile: 𝑆𝑆𝑡𝑜𝑡𝑎𝑙 = 𝑆𝑆𝐹𝑎𝑘𝑡𝑜𝑟 𝐴 + 𝑆𝑆𝐹𝑎𝑘𝑡𝑜𝑟 𝐵 + 𝑆𝑆𝐹𝑎𝑘𝑡𝑜𝑟 𝐴𝑥𝐵 + 𝑆𝑆𝑤𝑖𝑡ℎ𝑖𝑛
Dies unterscheidet sich von der einfaktoriellen Varianzanalyse, die nur in zwei Teile zerlegt wird.
→ Die Zusammensetzung erfolgt also zwischen Quadratsumme der beiden Faktoren A und B, der Quadratsumme des Interaktionseffekts und der Quadratsumme des Fehlers (𝑆𝑆𝑤𝑖𝑡ℎ𝑖𝑛).
→ Vorteil des Interaktionseffektes: Anteil der nicht-erklärbaren Varianz (Fehlervarianz) wird um die auf den zweiten Faktor und die Interaktion zurückgehende Varianz reduziert
Was ist das Ziel der Kreuzvalidierung?
Die Generalisierbarkeit der Regressionsgleichung und somit die externe Validität zu überprüfen
Wie wird der F-Wert in der ANOVA interpretiert?
Er beschreibt das Verhältnis zwischen erklärter und unerklärter Varianz
Hoher F-Wert deutet auf signifikante Gruppenunterschiede hin.
Was zeigt der p-Wert in der ANOVA?
Ob der F-Wert statistisch signifikant ist
Ein p-Wert < 0.05 bedeutet signifikante Unterschiede zwischen den Gruppen.
Was ist partielles Eta-Quadrat (n2)?
Ein Effektstärkemaß, das angibt, wie viel Varianz in der abhängigen Variable durch einen Faktor erklärt wird
Kleine Effekte: n2 = 0.01, mittlere Effekte: n2 = 0.06, große Effekte: n2 = 0.14
Was ist ein Interaktionseffekt?
Prüft, ob die Wirkung eines Faktors von einem anderen Faktor abhängt
Beispiel: Ein Programm könnte für Männer effektiver sein als für Frauen.
Füllen Sie die Lücke: Der F-Wert beschreibt das Verhältnis zwischen der _______ und der unerklärten Varianz.
erklärten Varianz
Was sind die Schritte zur Interpretation einer ANOVA?
- F-Wert auf statistische Signifikanz mittels p-Wert prüfen
- Effektstärke (n2) beurteilen
- Haupteffekte und Interaktionseffekte analysieren
Aufgabe 1: Die Inferenzstatistik beruht auf dem Prinzip der Hypothesentestung. Beschreiben Sie kurz die Schritte bei der Hypothesenprüfung.
- Formulierung von Null- und Alternativhypothese
- Festlegung eines Signifikanzniveaus Alpha
- Festlegung des Stichprobenumfangs und Stichprobenart
- Erhebung einer Stichprobe, Auswahl des Testverfahrens und Ermittlung der Kennwerte
- Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese
- Entscheidung/Signifikanzprüfung: Vergleich des beobachteten Werts mit dem kritischen Wert
- Falls Signifikanz vorliegt: Interpretation der Effektgröße
Aufgabe 2: Planung von Maßnahmen der betrieblichen Gesundheitsförderung zur besseren Work-life-Balance. Experimentalgruppe bekommt Intervention mit gesundheitsförderlichem Charakter (Yoga, Entspannung etc.), Kontrollgruppe bekommt Intervention ohne gesundheitsförderlichen Charakter. Welche Möglichkeiten gibt es, um Teststärke zu erhöhen? Und Vorschlag machen, wie speziell für dieses Studiendesign Maßnahmen zur Erhöhung der Teststärke aussehen könnten.
1. Erhöhung des Stichprobenumfangs: Eine größere Stichprobe erhöht die statistische Kraft einer Studie und reduziert das Risiko von ß-Fehlern, wodurch die Teststärke erhöht wird.
2. Festlegung eines hohen Signifikanzniveaus: Je höher das α-Niveau a priori festgelegt wurde, desto höher ist auch die Teststärke und desto geringer fällt der 𝛽 -Fehler aus. Bei einem großen Datenvolumen bietet es sich an, ein Signifikanzniveau von 1 % festzulegen (α = 0.01).
3. Ein- oder zweiseitige Testung: Eine einseitige Testung ist Teststärker als eine zweiseitige Testung, da dieser einen höheren 𝛽 -Fehler zur Folge hat. Demnach wäre es sinnvoll auch im hier genannten Beispiel eine einseitige Testung zu bevorzugen.
4. Homogenität der Merkmalsverteilung: Je geringer das untersuchte Merkmal streut, desto größer ist die Teststärke und der 𝛽 -Fehler fällt geringer aus. Um eine geringe Streuung anzustreben, wäre es sinnvoll eine große Stichprobe zu erheben, um die Streuung möglichst zu reduzieren.
5. Größe des statistischen Effekts: Je größer der statistische Effekt (Unterschied, Zusammenhang), also die Differenz der Mittelwerte: ( µ𝟏 − µ𝟐), desto größer die Teststärke.
6. Abhängige vs. Unabhängige Stichproben: Bei Untersuchungen mit abhängigen Stichproben ist der 𝛽-Fehler geringer und somit die Teststärke größer als bei unabhängigen Stichproben. In diesem Fall kann man in Betracht ziehen, anstatt Experimental- und Kontrollgruppe mit Messwiederholungen zu arbeiten.
7. Informationsgehalt der Ausgangsdaten (Skalenniveau): Je höher das Skalenniveau, desto besser ist die Teststärke des Prüfverfahrens und desto geringer ist die Gefahr des 𝛽 -Fehlers. Die Erhebung der Daten sollte bestenfalls auf ordinal oder intervallskalenniveau erfolgen.
8. Voraussetzungen an die Verteilung: Je mehr Voraussetzungen erfüllt sind (Normalverteilung, Varianzhomogenität) desto höher ist die Teststärke.
9. Auswahl des statistischen Verfahrens: Parametrische Tests (bei der von einer theoretischen Verteilung ausgegangen wird) sind teststärker.
10. Eliminierung von Störvariablen und sorgfältige Validierung und Standardisierung.
Aufgabe 3.1: Versuchsdesign eines frei wählbaren Wilcoxon Vorzeichentest beschreiben und Nullhypothese aufstellen.
Ein Beispiel für ein Design für einen Wilcoxon Vorzeichentest für zwei abhängige Stichproben könnte sein:
- Versuchsdesign: Hat ein neu eingeführtes Trainingsprogramm einen Einfluss auf die Laufzeit der Teilnehmer? Jeder Teilnehmer absolviert zwei Laufversuche (vor und nach der Trainingsmaßnahme). Es erfolgt also ein Vorher-Nachher-Vergleich (vor und nach dem Trainingsprogramm) der Laufzeit in Minuten. Für jede Person werden also zwei Messwerte erfasst.
- AV: Die Zeit, die für das Laufen einer Strecke benötigt wird in Minuten.
- UV: Art des Programms: kein Program vs. Trainingsprogramm
- Nullhypothese: Es gibt keinen systematischen Unterschied zwischen den Zeiten vor/nach der Maßnahme (Summe der Rangplätze mit positiven Veränderungen ist gleich Summe der Rangplätze mit negativen Veränderungen)
- Alternativhypothese: Es gibt einen systematischen Unterschied (Summe der Rangplätze mit positiven Veränderungen ist ungleich Summe der Rangplätze mit negativen Veränderungen)
- Durchführung Test: Es wird die Differenz der Zeiten berechnet: Positive Differenzen (di>0) deuten darauf hin, dass sich die Laufzeit verschlechtert hat, negative Differenzen (di<0) deuten darauf hin, dass sich die Laufzeit verbessert hat, danach können diese den Rängen zugeordnet werden und Test erfolgt.
Aufgabe 3.2: Versuchsdesign eines frei wählbaren Man-Whitney U-Test beschreiben und Nullhypothese aufstellen.
Ein Beispiel für ein Design für einen U-Test von Mann-Whitney für zwei unabhängige Stichproben könnte sein:
• Versuchsdesign: Einer Kontroll- und einer Experimentalgruppe wird jeweils eine Lernmethode (Lehrbuch vs. Online-Tutorial) zugewiesen und Zeit für das Lösen einer Aufgabe gemessen, um herauszufinden, ob die gewählte Lernmethode einen Einfluss auf die Zeit hat, die die Teilnehmer zum Lösen einer Aufgabe benötigen.
• AV (abhängige Variable): Zeit, die benötigt wird, um eine Aufgabe zu lösen
• UV (unabhängige Variable): Art des Lernmaterials (Lehrbuch vs. Online-Tutorial)
• Nullhypothese: Es gibt keinen Unterschied in der Zeit, die benötigt wird, um die Aufgabe zu lösen, zwischen Personen, die das Lehrbuch als Lernmaterial nutzen, und Personen, die das Online-Tutorial als Lernmaterial nutzen → 𝑯𝟎: µ𝟏/𝟐 𝑷𝟏 = µ𝟏/𝟐 𝑷𝟐
• Alternativhypothese: Es gibt einen Unterschied in der Zeit, die benötigt wird, um die Aufgabe zu lösen, zwischen Personen, die das Lehrbuch als Lernmaterial nutzen, und Personen, die das Online-Tutorial als Lernmaterial nutzen → 𝑯𝟏: µ𝟏/𝟐𝑷𝟏 ≠ µ𝟏/𝟐 𝑷𝟐