random Flashcards
was sind die eigenschaften einer normalverteilung?
- sie sind eingipflig, symmetrisch und schließen die fläche 1 ein.
- es gibt unendlich viele normalverteilungen die sich durch mittelwert und standartabweichung formen.
- die standartabweichung bestimmtdie erstreckungsbreite der verteilung. er zeigt wie eng sich die daten um den mittelwert herumschmiegen
-
was für einen einfluss haben die standartabweichungen auf die normalverteilung und was kann man dadurch herausfinden?
- durch die standartabweichungen kann man die genaue prozentzahl der fläche erfassen.
- dies geht mit einer rechnunug
- möchte man 95% der fläche erfassen die sich symetrisch um den mittelwert herumschmiegen, so berechne man:
μ +- 2 x Sigma - bei 68% : μ +- Sigma
- bei 99% : μ +- 2,75 x Sigma
was gilt für die standart-normalverteilung? wie sieht sie aus?
die variable X ist normalverteilt mit dem
μ = 0 und Sigma = 1
was ist die formel für die standartisierte variable?
Z = (X - μ) / Sigma
was macht man wenn man herausfinden möchte wie viel prozent einer grundgesammtheit 180 oder kleiner ist.
man berechnet den z-wert indem man, schaut in der tabelle der standartnormalverteilung nach und kann daraus die prozentzahl schließen.
was macht man wenn man herausfinden möchte wie viel prozent einer grundgesammtheit 160 oder größer ist
man berechnet den z-wert, und schaut nachwo dieser wert in der tabelle der standartnormalverteilung steht. dieser wert wirt mit 1-P subtrahiert. bsp: 1-0.25 = 0.75 = 75%
was macht man wenn man herausfinden möchte wie viel prozent einer grundgesammtheit zwischen 1,61M und 171m ist.
man hat zwei z-werte
zuerst errechnet man den Z2 wert und zieht dann den Z1 wert davon ab. damit hat man dann das stück rechts neben z1 weg.
was besagt das ZGT?
Die Summe von unabh ̈angigen Variablen ist unter sehr allgemeinen Voraussetzungen immer (angenähert) normal verteilt – und zwar ins- besondere auch dann, wenn diese Variablen selbst individuell nicht normal verteilt sind.
fu ̈r die Erwartung und Varianz des Mittelwerts x(strich) von n unabh ̈angigen Realisationen einer Zufallsvariablen gilt stets:
- μx(strich) = μ (mittelwert der mittelwertsverteilung entsprich dem originalmittelwert)
- varianz von x(strich) = varianz durch n.
was ist die rechnung der varianz in der binomialverteilung?
n x p x ( 1- p )
sigma ist die wurzel aus der Varianz
was kann man mit der z transformation erreichen?
man kann die wk errechnen wie warscheinlich es ist in 100 würfen ein ereignis genau k mal zu beobachten.
- die geht in dem man ein flächenstück jeweils unter und über k in die z transformation einsetzt. x(k)-μ durch sigma
- der wert ist die prozentzahl (die wk)
wie errechnet man den erwartungswert?
μ = n x p
wie erfasst man die mittleren 95% der binomialverteilung?
μ-2 x Sigma ; μ+2 x Sigma
welche bedingungen hat das intervall μ-2 x Sigma ; μ+2 x Sigma
- n ≥ 25
- 0.10 ≤ p ≤ 0.90;
wennp sehr klein ( 0.90) ist, dann muss n gro ̈ßer sein.
erläutere den fehler erster zweiter art.
der beta fehler:
wennman die h1 verwirft obwohl sie zutrifft.
was die korrekte zuweisung der h1
man verwirft die h1 und die Ho trifft zu.
wie lassen sich der alpha und beta fehler reduzieren?
durch einen größeren stichprobenumfang. wenn n sich vergrößert, denn nimmt die streuung ab.
wann setzt man die t-verteilungein?
- für konfidenzintervalle für mittelwerte.
- jeder stichprobenumfang hat eine individuelle t-verteilung.
- notwendige taden sind dafür “n”
wie nennt man den index indem man die daten der t-verteilung findet?
freiheitsgrade
wannn sieht die t-verteilung normalverteilt aus?
wenn der stichprobenumfang größer oder gleich 26 ist.
dann sind die freiheitsgrade mindestens 25 und sie sieht identisch mit der normalverteilung aus.
- bei weiger df sieht sie breiter aus
was ist eine statistische hypothese?
es ist eine behauptung über eine wk oder einem verteilungsmerkmal in der untersuchten grundgesammtheit
was ist die absicht der teststatistik?
- die teststatistik ist eine zahl die sich aus den erhobenen daten eindeutig angeben oder berechnen lässt.
- der test besteht darin umzusehen ob die erhobenen daten mit der h0 vereinbar sind.
– die daten müssen zu einem representativen wert aggregiert werden. dieser wert muss möglichst erschöpfend zusammengefasst werden um scharf zw H0 und H1 zu trennen.
- jedes testverfahren formuiert ein bestimmtes statistisches modell für die beobachteten daten.
warum werden krittische werte in der teststatistik verteilt?
- um den annahmebereich der H0 zu begrenzen.
- nur dann kann man die entscheidungsregel formulieren
schritte einer gerichteten teststatistik:
- formuliere junnhypothese
- wähle teststatistik aus um H0 zu prüfen: bsp x2, oder mcnemar
- lege signifikanzniveau alpha fest
- wähle umfang der zu erhebenden stichprobe
5 finde die verteilung unter der bedingung dasd H0 zutriffe. Bsp: binomialvertilung - bestimme den annahmebereich unter der bedingung dass die H0 zutrifft.
- erhebe die empirische stichprobe und berechne den beobachteten wert der teststatistik. liegt er im annahmebereich, dann ebhalte die H0 bei. beibehalten heißt nicht dass die H0 gilt. es sagt nur dass die evidenz zu schwach ist.
gründe: zu kleine stichprobengröße, zu große streuung