5 - Univariante Analyse Flashcards
(33 cards)
Was ist die univariante Analyse?
Analyse der Verteilungen einzelner Variablen
Worauf bezieht sich die univariante Analyse
Sie bezieht sich auf Kollektive.
Ausprägungen und durchschnittliche Werte beschreiben somit eine Gruppe und nicht einzelne Personen.
Wie können Verteilungen der univarianten Analyse dargestellt werden?
Verteilungen können in tabellarischer Form dargestellt (Häufigkeitstabellen) oder durch Grafiken illustriert werden.
Was stehen der univarianten Analyse zur Verfügung?
- je nach Skalenniveau stehen ihr statistische Maßzahlen/Kennwerte zur Verfügung
Warum - zur Beschreibung der Verteilung
Wie lauten die 3 Gruppen der Maßzahlen?
- Maße der zentralen Tendenz: zentrale Werte (Mittelwert) der Verteilung
- Streuungsmaße: charakterisieren die Variabilität eines Merkmals und ermöglichen so Aussagen über die Homogenität/Heterogenität der Stichprobe bezüglich eines Merkmals.
- Verteilungsmaße: Verteilung in Bezug auf theoretische Verteilungen (Normalverteilung)
Was bedeuten Kennwerte auch immer?
= Inforeduktion,
daher stets die Häufigkeitstabelle heranziehen und je Variable vergleichen!
Was sind die Kennwerte der zentralen Tendenz?
Kennzeichnung der Lage des Zentrums (Mittelwerte) einer (Häufigkeits‐)Verteilung
- Modus (größte Häufigkeit - nominal)
- Median (mittlere Position)
…. ordinal) - Mittelwert bzw. arithmetisches Mittel (Zentralität der Werte -metrisch)
Was ist die nützlichste Funktion des Modus?
nützlichste Funktion des Modus ist die Charakterisierung bi‐ und multimodaler Verteilungen.
Was macht der Median?
Sie teilt die Menge der gereihten Messwerte in zwei gleich große Hälften, d.H.
- bei metrischen Daten: 50% niedrigere Werte, 50% höhere Werte
- bei ordinalen Daten: „Medianklasse“ (d.H. in welcher Kategorie 50% erreicht wurden, bezieht sich auf die kummulierten Prozent)
Was repräsentiert der Median bei geraden und ungeraden Anzahlen bei Fällen?
ungerade Anzahl an Fällen: Median repräsentiert tatsächlich vorhandenen Wert
gerade Anzahl von Fällen: Median ist der halbierte Wert der mittleren beiden Fälle
Was ist der Vorteil eines Medians
im Vergleich zum Mittelwert: er ist relativ robust gegen Ausreißer.
Was ist der Mittelwert?
Gängiges Maß zur durchschnittlichen Berechnung von Ergebnissen.
Immer auch die Standardabweichung erwähnen!
Was ist ein Nachteil beim Mittelwert?
Mittelwert ist anfällig für Ausreißer und kann bei Extremwerten und bei asymmetrischen Verteilungen verzerrt
sein.
Daher bei Verzerrungen innerhalb der Daten besser Median verwenden!
Was ist ein Streuungsmaß?
Charakterisierung der Variabilität eines Merkmals anhand der Heterogenität/Homogenität der Verteilungen.
Nenne die unterschiedlichen ordinalen Streuungsmaße?
- Min, Max., Range
- Quartile und Quartilabstand
Beschreibe Minimum, Maximum und Range.
- Range (Spannweite) ist die Differenz zwischen dem größten (max.) und kleinsten (min.) Messwert innerhalb der Verteilung.
Was ist ein Quartil?
- Quartile bilden Schnittpunkte zw. den Vierteln einer Verteilung
- Teilt man eine Verteilung in Quartile, trennen diese die oberen und unteren 25% von den mittleren 50% der Verteilung.
Was ist ein Quartilabstand?
= Interquartilsbereich:
- die mittleren 50% der Verteilung (zwischen dem 1. und 3. Quartil bzw. 25 und 75 %) d.H. die unteren und oberen 25% der Verteilung werden ignoriert.
Der Wert ist wiederum (ähnlich wie der Median) eher bei extremen Verteilungen relevant.
- Analysegrafik: Boxplot
Was ist die metrische Streuungsmaße?
= berücksichtigen alle Messwerte der Verteilung (nicht nur zwei Messwerte wie bei Quartilsabstand und Range)
Was beinhaltet die metrische Streuungsmaße?
- Varianz
- Standardabweichung
Beschreibe die Varianz?
- Kann nicht interpretiert werden.
- Würde man die Summe der Abweichungen jedes einzelnen Messwertes vom arithmetischen Mittelwert berechnen, würde man 0 erhalten -> daher für Varianzberechnung - quadrierten Abweichungen.
Varianz = Vor(berechnungs)stufe der Standardabweichung.
Beschreibe die Standardabweichung!
- Wurzel aus der Varianz
- Kennwert in der Einheit der Variable (wie z.B. Skalenpunkte, Alter, …)
- exakte Aussage bzw. Beurteilung über Streuung nur durch Vergleich von Verteilungen mit gleicher Skalierung.
- weil je nach Skalierung der Variable unterschiedlich große Streuungswerte entstehen.
Welche Formen von Verteilungen gibt es?
- Verteilung in Bezug auf theoretische Verteilungen (Normalverteilung)
- Abstraktion: von konkreter Verteilung zu „Verteilungstypen“
- nur für metrisches Skalenniveau
Welche Faustregeln der Interpretation gibt es?
- Standardfehler (Standard Error) verdoppeln
- Wert mit Wölbung (Kurtosis) bzw. Schiefe (Skewness) vergleichen
Interpretation:
- „signifikant“, wenn
Wert höher als ihr verdoppelter Standardfehler von der Normalverteilung (sonst normalverteilt)
- „starke Streuung“ nur
bei flacher Wölbung - Vorzeichen (spielt beim Vergleich mit dem Standardfehler keine Rolle