Statistik II Flashcards
(122 cards)
Wie entsteht der Beta-Fehler?
- geringe Stichprobengröße -> dadurch großer Standardfehler
- zufällige Stichproben werden gezogen -> zwei ungünstige Stichproben werden gezogen
Erkläre den Beta-Fehler
- Beibehaltung der Nullhypothese obwohl sie nicht richtig ist
- Fehler 2. Art
- Test zeigt keinen signifikanten Unterschied obwohl es einen gibt
- kann bei Planung der Untersuchung beeinflusst werden
- Eine Alarmanlage gibt Keinen Alarm trotz Einbruchs
- Ein Test für Depressionen ist negativ obwohl Depression vorliegt
Erkläre den Alpha-Fehler
- Ablehnung der Nullhypothese obwohl diese richtig ist
- Fehler 1. Art
- Entsteht wenn die Nullhypothese in der Population gilt und diese fälschlicherweise abgelehnt wird
- Test zeigt einen signifikanten Unterschied obwohl es keinen gibt
- Eine Alarmanlage gibt einen Alarm ohne Einbruch
- Test schlägt positiv auf Depression an obwohl keine vorliegt
Welche Gefahr ergibt sich beim Hypothesentesten?
Nenne beide Fehlerarten
- Gefahr einen falschen Schluss von Stichprobenparametern auf Populationsparameter zu ziehen
- Alpha- und Beta-Fehler
- beide Fehlerarten hängen zusammen
Was versteht man unter einer zweiseitigen Testung?
- ergibt sich aus einer ungerichteten Hypothese
- keine Aussage über die Richtung möglich
- Differenzen müssen groß genug sein um signifikant zu sein
- Fläche von 5% wird an beiden Enden der Verteilung verteilt (jeweils 2,5%)
- Vorteil: explorativ können Unterschiede getestet werden, auch ohne ausreichende Grundlage für gerichtete Hypothese
Was versteht man unter einer einseitigen Testung?
- liegt einer gerichteten Hypothese zugrunde
- Richtung des Mittelwertunterschieds wird aus z.B. Voruntersuchung abgeleitet
- Annahmebereich liegt somit auf einer Seite (Richtung) der Verteilung
- Vorteil: Unterschiede bei einseitiger Testung werden schon bei geringeren Differenzen signifikant als bei zweiseitiger
- als wissenschaftlicher angesehen, gerichtete Hypothesen sind aus Literatur abgeleitet
Wann wird die H0 verworfen?
- Differenz der beiden Stichprobenparameter liegen außerhalb des Beibehaltungsbereich der Nullhypothese -> H1 wird angenommen
- a-Niveau legt Grenzwert fest, der quasi maximale Mittelwertdifferenz zur Aufrechterhaltung der Nullhypothese erlaubt
Wann wird die H0 beibehalten?
- Stichproben unterscheiden sich nicht signifikant -> wenn Differenz der beiden Stichprobenmittelwerte so gering ist, dass sie innerhalb des Annahmebereichs liegt
- Stammen aus identischen Populationen mit Mittelwert u
Wie wird das a-Niveau festgelegt?
- Irrtumswahrscheinlichkeit liegt in der Regel bei 5% ( 1% oder .1% ebenfalls möglich)
- Höhe des a-Niveaus wird immer beim Aufstellen der Hypothese festgelegt und darf nachträglich nicht mehr verändert werden
Was ist das Nutzen des a-Niveaus?
- wichtig für Beibehaltung / Ablehnung der Nullhypothese
- durch vorheriges Festlegen des a-Niveaus wird der Fehler 1. Art kontrolliert
Definieren Sie das a-Niveau / Signifikanzniveau a
- legt, in Abhängigkeit von Stichprobengröße und zu Grunde liegender theoretischer Verteilung, eine Fläche unter der Verteilungskurve (einen Grenzwert) für ein Konfidenzintervall fest
- liegt der ermittelte Kennwert außerhalb dieses Konfidenzintervalls, so wird die H0 verworfen und die H1 angenommen
- das a-Niveau ist die Wahrscheinlichkeit, die vom Forschenden festgelegt wird, mit der Ablehnung der H0 bei einem Signifikanztest zu einem Fehler 1. Art führt
- > also die obere Grenze, für die von Forschenden tolerierten Fehler, mit dem H0 fälschlicherweise abgelehnt wird
-je kleiner das Signifikanzniveau alpha, desto kleiner die Teststärke
Nennen Sie das Gerüst, wie man eine Hypothese formuliert
-Es sei μ1 die mittlere (…) in der Population der (…) und es sei μ2 die mittlere (…) in der Population der (…)
-Dann gilt:
->H0: μ1 = μ2
und
->H1: μ1 ≠ μ2 ( ungerichtet )
oder
->H1: μ1 > μ2 bzw. μ1 < μ2 ( gerichtet )
bei einem a-Niveau von 5%
Erläutere die grundlegende Idee der Inferenzstatistik in 6 Schritten
- Es gibt für ein untersuchtes Merkmal einen bestimmten Populationsmittelwert ux
- Mittlerwerte zufällig aus der Population gezogener Stichproben streuen um Populationsmittelwert ux -> begründet mit zentralem Grenzwert. Hierdurch kann theoretische Verteilung der Kennwerte definiert werden sowie statistische Aussagen unter Voraussetzung von H0 möglich
- Wenn zwei Stichprobenmittelwerte sehr ähnlich:
- sehr wahrscheinlich, dass sie aus identischen Populationen stammen
- beide Stichprobenmittelwerte dann gute Schätzer für Populationsparameter ux - Wenn beide Stichprobenmittelwerte sehr unterschiedlich: stammen möglicherweise nicht aus identischer Population.
Je größer Differenz zwischen x1 und x2, desto unwahrscheinlicher, dass sie aus gleicher Population stammen - Mit Wahrscheinlichkeitsverteilung wird die bedingte Wahrscheinlichkeit für die Differenz der Stichprobenmittelwerte bei Gültigkeit H0 berechnet -> Erwartungswert für Wahrscheinlichkeit liegt bei 0
- Liegt die berechnete Wahrscheinlichkeit der H0 unter gewissem Grenzwert (a-Niveau), so ist die beobachtete Differenz nicht mit der Nullhypothese zu vereinbaren
- > somit stammen die Stichproben nicht aus identischen Population, sondern aus unterschiedlichen Populationen, die sich signifikant unterscheiden
Sollte besser eine gerichtete oder eine ungerichtete Alternativhypothese verwendet werden?
Sinne der beiden Hypothesen wird kontrovers diskutiert
- Gerichtete: gelten wissenschaftlicher, weil theoretische Vorannahme notwendig ist
- Ungerichtete: exploratives Vorgehen: unwissenschaftlicher, da mit geringerem theoretischen Hintergrund empirische Daten untersucht werden
-generell gilt: mit explorativem Vorgehen darf nie Mangel an Vorüberlegungen und theoretischer Fundierung kaschiert werden
Erläutern Sie eine gerichtete Alternativhypothese
- theoriegeleitete Vorgehensweise (Auf Basis von vorherigen Untersuchungen bzw. theoretischen Vorüberlegungen)
- gibt Richtung des Unterschieds zwischen Stichprobenkennwerten an
- vor Datenerhebung wird bestimmt in welcher Stichprobe der höhere Wert erwartet wird
- geht Differenz nachher in andere Richtung, MUSS Nullhypothese beibehalten werden
- höherer Stellenwert als ungerichtete Alternativhypothese
Erläutern Sie eine ungerichtete Alternativhypothese
-Exploratives Vorgehen: keine Aussage über Richtung des Unterschieds, nur, dass Unterschied zwischen zwei Stichprobenkennwerten vorhanden ist
(Nur Existenz des Unterschieds wird untersucht)
Erläutern Sie was eine Alternativhypothese ist
- Eine Positivhypothese
- besagt, dass ein Unterschied oder Zusammenhang in der Population existiert
- sollte immer aus Theoriegebäude (Vorstudie & Literatur) abgeleitet
- H1
- wenn H0 nicht gültig, dann müssen H1 gültig sein
- Unterscheidung zwischen gerichteter und ungerichteter Hypothese
- Komplementär: Nullhypothese
Erläutern Sie was eine Nullhypothese ist
- eine Negativhypothese
- H0
- nimmt an: es gibt keine Zusammenhänge / Unterschiede in der Population
- Annahme: Mittelwerte oder Zusammenhänge sind nur zufällig entstanden bei Stichprobenziehung
- Komplementär: Alternativhypothese
Hypothesen nennen und wie sie zueinander stehen
- Nullhypothese und Alternativhypothese
- schließen sich gegenseitig aus, decken zusammen alle möglichen Fälle ab
- Grundlage immer Nullhypothese. Nur wenn Gültigkeit der Nullhypothese sehr unwahrscheinlich
- > Alternativhypothese angenommen
Definieren Sie Hypothesenprüfung
-inferenzstatistische Hypothesenprüfung erlaubt Aussagen über Gültigkeit von Hypothesen in einer Population aus welcher die untersuchten Stichproben zur Hypothesenprüfung gezogen wurden.
Es werden über Stichprobenkennwerte die Populationskennwerte geschätzt und mit diesen Schätzungen dann Hypothesenprüfungen durchgeführt
Was ist die Aufgabe / das Ziel der Hypothesenprüfung?
- induktives Schließen von einer Stichprobe auf die Population
- beruht auf dem Prinzip der Hypothesentestung
- mit Hilfe der Inferenzstatistik schätzen wir ab, wie wahrscheinlich ein gefundenes Ergebnis unter einer gegebenen Hypothese ist
- in der Inferenzstatistik wird geprüft ob die beobachteten Daten mit den theoriegeleiteten Erwartungen vereinbar sind
Wie können a- Fehler und ß-Fehler minimiert werden?
durch:
- Erhöhung des Stichprobenumfangs
- gerichtete Testung
- ein teststarkes Verfahren
- eine geringe Merkmalsstreuung
- einen hohen Mittelwertunterschied
- hohes a-Niveau kann der ß-Fehler verdrängt werden
- der a-Fehler kann nach der Datenerhebung nicht mehr beeinflusst werden, da er vor der Untersuchung zu definieren ist
Wie sollte das Verhältnis von a-Fehler und ß-Fehler sein?
Faustregel: 4:1
(a-Fehler: 5% / ß-Fehler: 20% oder
a-Fehler: 1 % / ß-Fehler 4%)
Was versteht man unter Teststärke?
- ist über 1-ß definiert
- stellt die Wahrscheinlichkeit dar, einen Effekt zu finden, wenn er existiert (1-Beta)
- anders formuliert: stellt die Wahrscheinlichkeit dar, mit der ein Signifikanztest zugunsten der Alternativhypothese (H1) unterscheidet unter der Bedingung, dass der besagte Effekt wirklich in der Population vorliegt
- auch als Trennschärfe oder power bezeichnet
- sie verläuft gegenläufig zum ß-Fehler