Vorlesung 4 Flashcards
(42 cards)
Statistik als Teilgebiet der Stochastik
- Explorative Statistik
systematische Suche nach Zusammenhängen zwischen Daten - Stochastik
Statistische Wahrscheinlichkeitstheorie - Wahrscheinlichkeitstheorie
Zuordnung von Ereignissen und Wahrscheinlichkeiten - Mathematische Statistik
auch induktive oder schließende Statistik, Massenerscheinungen (große
Datenmengen) mit Wahrscheinlichkeitsrechnung beurteilen - Deskriptive Statistik
Verdichtung von Daten zu Tabellen, graphische Darstellung und Kennzahlen
(auch Lagemaße oder Standardabweichung)
Grundgesamtheit
Die Grundgesamtheit ist die Menge aller möglichen Objekte über die man im Zuge einer
statistischen Erhebung eine Aussage machen möchte. Die Größe der Grundgesamtheit kann
begrenzt oder unbegrenzt sein.
Stichprobe
Als Stichprobe bezeichnet man eine Teilmenge einer Grundgesamtheit. Ihre Größe ist immer
begrenzt.
Arithmetischer Mittelwert
beschreibt den statistischen Durchschnittswert
Empirischer Median
mittlerer Wert einer geordneten Messreihe (z.B. aussagekräftiger bei
Einkommensdurchschnitt von 98 Normalverdienern und 2 Spitzenverdienern)
Empirischer Modalwert (Modus)
Wert, der am häufigsten Vertreten ist (Werbung)
Geometrisches Mittel
(Wirtschaftsstatistik; weniger anfällig gegenüber Ausreißern ohne sie auszuschließen)
Skalenniveaus
Das Skalenniveau drückt aus, wie quantitativ ein Antwortwert ist, das heißt, inwieweit
sinnvolle Rechenoperationen angewendet werden können. Es werden vier Skalenniveaus
unterschieden
Nominaskala
(nicht-metrisch bzw. kategorial; Darstellung und Klassifizierung qualitativer
Eigenschaftsausprägungen. Der Modus kann identifiziert werden):
Geschlecht (männlich, weiblich) oder Farbe (blau, gelb, grün, rot usw.)
Ordinaskala
(nicht-metrisch bzw. kategorial; Aufstellung einer Rangordnung -
besser/schlechter, größer/kleiner, häufiger/seltener usw. - mit Hilfe von Rangwerten. Modus
und Median können identifiziert werden):
Art des Wohnorts (Einzelhaus, Dorf, Kleinstadt, Großstadt)
Fahrzeugklasse (Kleinwagen, unterer Mittelklassewagen, oberer Mittelklassewagen usw.)
Intervallskala
(metrisch; gibt quantitative Werte wieder. Modus, Median und
arithmetisches Mittel können berechnet werden. Ist immer in gleichgroße Skalenabschnitte
unterteilt. Im Gegensatz zur Verhältnisskala hat die Intervallskala keinen natürlichen
Nullpunkt): Temperatur in Celsius oder IQ-Skala
à Nicht x ist doppelt so groß wie y (10 Grad ist nicht doppelt so heißt wie 5 Grad)
Ratioskala/Verhältnisskala
(metrisch; Modus, Median und arithmetisches Mittel können
berechnet werden. Gültigkeit von Verhältnissen: ein Einkommen von 4000 € ist doppelt so
groß wie ein Einkommen von 2000 €): Körpergröße oder Monatseinkommen
Standardabweichung
Oft blenden Durchschnittswerte wichtige Informationen aus: „Die Deutschen trinken pro
Jahr durchschnittlich 20 Liter Wein“. (Manche trinken nichts, andere zu viel). Deshalb fügt
man Durchschnittswerten am besten immer auch ein Maß für die Abweichung (Streuung)
vom Durchschnitt (Mittelwert) bei, wie die Standardabweichung.
Die Standardabweichung ist ein Maß für die Streubreite der Werte eines Merkmals rund um
dessen Mittelwert (arithmetisches Mittel).
Verteilungen
Skizze
Eine Verteilung gibt die Wahrscheinlichkeit einzelner Zufallsvariablen an. Sie kann als Verteilungs- oder Dichtefunktion angegeben werden. Aus den Funktionen kann für den Wert x0 die Wahrscheinlichkeit ermittelt bzw. abgelesen werden [Dichtefunktion: Integral bis x0; Verteilungsfunktion F(x0)], mit der der Wert x0 unterschritten wird.
à Das Integral bis xo beschreibt
Wahrscheinlichkeit, dass Ereignis eintritt
à Verteilungsfunktion ist deutlicher,
endet immer bei 1 oder 100%
Verteilungen Logarithmische Normalverteilung
Anwendung der Log-Normalverteilung
Verteilungen in der Natur (Hochwasser, Ernteerträge); Zeitstudien & Lebensdaueranalysen; Konzentrations- und Reinheitsprüfungen.
Verteilungen Logarithmische Normalverteilung
Merkmale
Einseitige Begrenzung durch null; Multiplikatives Zusammenwirken mehrerer Effekte.
Anwendung der Normalverteilung
Körpergröße, Körpergewicht, Produktionsmaße (häufig
bei großen Grundgesamtheiten)
Merkmale: Mittelwert = Median; symmetrisch; eingipflig
Verteilungen Exponentialverteilung
Zeit des Atomzerfalls bei radioaktiven Stoffen, Arbeitszeit einer Maschine zwischen zwei Stillständen, Lebensdauer von Bauelementen oder Lebewesen
Verteilungen Exponentialverteilung
Merkmale
Einseitige Begrenzung durch null; Maximalwert der Funktion bei null.
Berechnung eines Konfidenzintervalls
Was ist das Konfidenzintervalll
à mü = Mittelwert, unbekannt
à xquer = bekannt aus Stichprobe
„Aufspannen“ eines Unsicherheitsbereiches um den berechneten Mittelwert einer
Stichprobe (x) zur Abschätzung des Mittelwertes der Grundgesamtheit μ
à Zur Abschätzung eines unbekannten Mittelwertes der Grundgesamtheit μ werden auf
Basis einer Stichprobe mit dem Umfang n sowie den berechneten Größen „Mittelwert“ (x)
und „Standardabweichung“ (s) der Stichprobe Konfidenzgrenzen berechnet.
Berechnung eines Konfidenzintervalls
Der Student-Faktor tm;1-a/2
m = n-1 (Umfang der Stichprobe minus 1)
a: vorgegebene statistische Sicherheit (z.B. 95%)
kann als Funktion des Stichprobenumfanges und der statistischen Sicherheit einer Tabelle
entnommen werden.
Berechnung eines Konfidenzintervalls
Einseitiges Konfidenzintervall
à Klausurfrage auf gelbe Formel bezogen à Anpassung der Formel: Obere Grenze = + Untere Grenze = - à gegeben n (Stichprobe)=10 und Ergebnis bei 95% Sicherheit à Tabellenwert ablesen bei n-1 = 9 und 95% Sicherheit à in Formel einsetzen und ausrechnen Beispiel für eine einseitige ([meist] obere Konfidenzgrenze) Fragestellung: maximale Bodenkonzentration im Rahmen einer Gefährdungsabschätzung
Berechnung eines Konfidenzintervalls
Zweiseitiges Konfidenzintervall
à verteilt auf zwei Seiten
à n = 10 und Eintrittswahrscheinlichkeit 97,5%
à Eintrittswahrscheinlichkeit 95% gefordert, weil
Sicherheit auf beiden Seiten bestehen muss (nicht
auf einer Seite 5% sondern auf beiden Seiten 2,5%)
ist Eintrittswahrscheinlichkeit in Tabelle 97,5%
Beispiel für eine zweiseitige (obere und untere
Konfidenzgrenze) Fragestellung: Herstellung eines
Produktes (z. B. Kolben), mit engen Maßvorgaben
Messbares Risiko
objektives Risiko
beruht auf naturwissenschaftlich messbaren Risikokriterien