Statistische Maße/Beschreibung von Verteilungen Flashcards
(15 cards)
Lagemaße
Maßzahlen zur Lage beschrieben das Zentrum einer Verteilung durch einen numerischen Wert.
Arithmetisches Mittel(Mittelwert)
Median
Modus
Geometrisches Mittel
HarmonischesMittel
Quantile
Arithmetisches Mittel (Mittelwert)
- Alle beobachteten Werte aufsummieren und Summe durch Anzahl der Beobachtungen dividieren
- MetrischeMerkmale
- Bei gruppierten Daten: Klassenmitten nehmen und dann mit relativen Klassenhäufigkeiten gewichten und auf addieren
Median
- So in Datenmitte platziert, dass eine Hälfte der Daten unterhalb und die andere Hälfte oberhalb des Medians liegt (0,5-Quantil)
- Für ungerades n ist der Median die mittlere Beobachtung der geordneten Urliste
- Für gerades n ist der Median das arithmetische Mittel der beiden in der Mitte liegenden Beobachtungen
- Mindestens ordinalskaliertes Merkmal
- Vorteil: Resistenz, Robustheit, einfache Interpretierbarkeit
- Bei gruppierten Daten: Einfallsklasse des Medians bestimmen und dann sie absolute Häufigkeit der Beobachtungen, die kleiner sind durch den Gesamtstichprobenumfang dividieren
Modus
- Gibt an, welche Ausprägung am häufigsten vorkommt
- Beliebig skaliertes Merkmal
- Bei gruppierten Daten: Klasse mit der größten Beobachtungszahl (Modalklasse) bestimmen und Klassenmitte als Modus verwenden
Geometrisches Mittel
- idR bei Wachstums- oder Zinsfaktoren verwendet, wenn mehrere Zeitperioden
- Alle Faktoren miteinander multiplizieren und daraus n-te Wurzel ziehen
- Bei Merkmalen mit nur positiven Werten und verhältnisskaliert sind
Harmonisches Mittel
- Typisch bei durchshcnittlicher Geschwindigkeit
- Bei Merkmalen mit nur positiven Werten und verhältnisskaliert sind
Quantile
- Größte Unterschranke einer gewissen Menge
- Quantile und daraus abgeleitete Box-Plots sind geeignete Mittel, um die Streuung der Daten zu charakterisieren
- Quartil als spezieller Typus von Quantilen
Streuungsmaße
Varianz und Standardabweichung
Entropie
Varianz und Standardabweichung
- Die Varianz kennzeichnet die Verteilung von Werten um den Mittelwert; arithmetisches Mittel minimiert die Varianz als Abstandsmaß
- Varianz ist groß/klein, wenn Daten weit/eng um ihren Mittelwert streuen
- Standardabweichung ist die Wurzel aus der Varianz
- Metrische Merkmale
- Verschiebungssatz
- Transformationsregel
- Varianzzerlegung:
Gesamtstreuung = Streuung innerhalb Schichten + Streuung zwischen Schichten - Variationskoeffizient: Standardabweichung geteilt durch arithmetisches Mittel
Entropie
- Vergleich mit äquifrequenten Verteilungen
- Nominal- oder ordinalskalierte Merkmale
Konzentrationsmaße
Bei der Konzentration von Merkmalen auf Merkmalsträger ist Ziel, die Stärke der Konzentration in einem Kennwert bzw in einer Grafik zum Ausdruck zu bringen
- Relative Konzentration
= Kleiner Anteil der Merkmalsträger verfügt über großen Anteil des Gesamtmerkmalsbetrages (Relationen)
-> Lorenzkurve
-> Gini-Koeffizient - Absolute Konzentration
= Kleine Anzahl an Merkmalsträgern verfügt über großen Anteil des Gesamtmerkmalsbetrages (absoluteZahlen)
-> Konzentrationsrate
-> Herfindahl-Index
Lorenzkurve
- Gibt Aufschluss über Stärke der Konzentration
- Grundgedanke ist, darzustellen, auf welchen Anteil der kleinsten Merkmalsträger welcher kumulierte relative Anteil an der Gesamtmerkmalssumme entfällt
- Eigenschaften: Monotonie, Konvexität
Gini-Koeffizient
- Entspricht dem Doppelten zwischen Winkelhalbierender und Lorenzkurve eingeschlossenen Fläche
- Ist immer im Zusammenhang mit Lorenzkurve zu interpretieren
Kolnzentrationsrate
- Gibt wieder, welcher Anteil von den größten Merkmalsträgern gehalten wird
- Konzentrationskurve
Herfindahl-Indes
Messen, wie gleichmäßig die Merkmale auf die Elemente einer Grundgesamtheit verteilt sind