Konfidenzintervalle Flashcards

1
Q

Konfidenzintervalle

A

Wahrscheinlichkeitsintervall um den Populationskennwert

  • Zentraler Grenzwertsatz: Wenn ich aus einer Population wiederholt Stichproben ziehe, dann sind deren Kennwerte normalverteilt
  • Ich kann also um den Populationskennwert ein Intervall bilden, in dem der Kennwert einer zufällig gezogenen Stichprobe mit einer bestimmten Wahrscheinlichkeit enthalten sein wird
  • Diese Logik drehe ich nun um, um Konfidenzintervalle zu konstruieren …
  • Konfidenzintervalle schätzen den Populationskennwert ausgehend vom Stichprobenkennwert. Das Intervall wird um den Stichprobenkennwert herum gebildet

Konfidenzintervall um den Stichprobenkennwert

  • Mit einem Konfidenzintervall kann man KEINE Wahrscheinlichkeitsaussage über den wahren Populationskennwert machen (außer ich spreche von einem unbestimten Intervall ohne feste Grenzen)
  • Man weiß nur eines: Wenn man unendlich viele Stichproben aus derselben Population zieht und anschließend 90%-Konfidenzintervalle konstruiert, dann enthalten 90% dieser Intervalle den wahren Populationskennwert
  • Das Konfidenzintervall, das ich auf Grundlage meiner einen Stichprobe konstruiert habe, ist also zu 90% eines der “richtigen” Intervalle und enthält dann den wahren Populationswert mit Wahrscheinlichkeit 1. Zu 10% ist es eines der “falschen” Intervalle und enthält dann den wahren Populationswert mit Wahrscheinlichkeit 0.
  • Je höher die Konfidenz, desto weiter wird das Intervall. Ein 95%-Konfidenzintervall ist weiter als ein 90%-Konfidenzintervall.
  • Konvention: 90% und 95% Konfidenzintervalle. 100% sind zwecklos, denn dann deckt das Intervall den gesamten Wertebereich ab und sagt nichts informatives mehr aus (trivial). 50% wären auch nicht gut, weil zu unsicher, zu geringe Aussagekraft.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vorgehensweise bei der Konstruktion von Konfidenzintervallen

A
  • Stichprobe ziehen und Stichprobenkennwerte berechnen.
  • Der Stichprobenanteil/-mittelwert wird als Schätzung für den Populationsanteil/-mittelwert benutzt und die Stichprobenvarianz ist die Grundlage für die Schätzung der Populationsvarianz: Die Summe der Abweichungsquadrate wird dabei durch n-1 und nicht durch n geteilt, um einer Unterschätzung entgegenzuwirken.
  • Die geschätzte Populationsvarianz wiederum ist die Grundlage für die Schätzung des Standardfehlers der Stichprobenverteilung. Der Standardfehler ist die Wurzel aus der geschätzten Populationsvarianz
  • In der z-Verteilung / t-Verteilung die passenden Werte für die gewünschte Höhe der Konfidenz bestimmen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Konfidenzintervalle für Anteile vs Mittelwerte

A

Konfidenzintervalle für Anteile

  • man nimmt die z-Verteilung

Konfidenzintervalle für Mittelwerte

  • die z-Verteilung versagt hier
  • stattdessen nimmt man die t-Verteilung, denn sie liefert für kleine Stichprobengrößen genauere Ergebnisse
  • William Gosset, ein Brauereiangestellter, entwickelte 1908 die t-Verteilung, um mit kleinen Stichproben aus Gerstenlieferungen die Qualität der Gerste beurteilen zu können
  • Im Unterschied zur z-Verteilung ist die t-Verteilung abhängig von der Stichprobengröße (für n gegen unendlich geht die t-Verteilung in die z-Verteilung über). Allerdings rechnet man nicht mit n selbst, sondern mit Freiheitsgraden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Konfidenzintervalle für Mittelwertsunterschiede - unabhängige vs abhängige Messung

A

Konfidenzintervalle für Mittelwertsunterschiede - unabhängige Messung

  • z.B. Vergleich zweier Stichproben womöglich unterschiedlicher Größe; between-subjects-design
  • Vorgehen: Die Populationsvarianzen beider Stichproben jeweils einzeln bestimmen. Dann aber den Standardfehler der Differenz schätzen (Formel: S.344)

Konfidenzintervalle für Mittelwertsunterschiede - abhängige Messung

  • within-subjects-design. Die beiden Messwertpaare korrelieren häufig und n ist bei beiden Stichproben gleich groß
  • Vorgehen: für jedes einzelne Wertepaar die Differenz bilden und einfach mit dieser soeben konstruierten dritten Variable ganz normal losrechnen
  • wenn die Messwertpaare positiv korrelieren → gemeinsamer Standardfehler wird kleiner → Konfidenzintervall wird kleiner als bei unabhängiger Messung → präzisere Schätzung
  • wenn die Messwertpaare negativ korrelieren → … → grobere Schätzung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly