5 - Univariante Analyse Flashcards

(33 cards)

1
Q

Was ist die univariante Analyse?

A

Analyse der Verteilungen einzelner Variablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Worauf bezieht sich die univariante Analyse

A

Sie bezieht sich auf Kollektive.

Ausprägungen und durchschnittliche Werte beschreiben somit eine Gruppe und nicht einzelne Personen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie können Verteilungen der univarianten Analyse dargestellt werden?

A

Verteilungen können in tabellarischer Form dargestellt (Häufigkeitstabellen) oder durch Grafiken illustriert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was stehen der univarianten Analyse zur Verfügung?

A
  • je nach Skalenniveau stehen ihr statistische Maßzahlen/Kennwerte zur Verfügung

Warum - zur Beschreibung der Verteilung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie lauten die 3 Gruppen der Maßzahlen?

A
  • Maße der zentralen Tendenz: zentrale Werte (Mittelwert) der Verteilung
  • Streuungsmaße: charakterisieren die Variabilität eines Merkmals und ermöglichen so Aussagen über die Homogenität/Heterogenität der Stichprobe bezüglich eines Merkmals.
  • Verteilungsmaße: Verteilung in Bezug auf theoretische Verteilungen (Normalverteilung)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was bedeuten Kennwerte auch immer?

A

= Inforeduktion,

daher stets die Häufigkeitstabelle heranziehen und je Variable vergleichen!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind die Kennwerte der zentralen Tendenz?

A

Kennzeichnung der Lage des Zentrums (Mittelwerte) einer (Häufigkeits‐)Verteilung

  • Modus (größte Häufigkeit - nominal)
  • Median (mittlere Position)
    …. ordinal)
  • Mittelwert bzw. arithmetisches Mittel (Zentralität der Werte -metrisch)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die nützlichste Funktion des Modus?

A

nützlichste Funktion des Modus ist die Charakterisierung bi‐ und multimodaler Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was macht der Median?

A

Sie teilt die Menge der gereihten Messwerte in zwei gleich große Hälften, d.H.
- bei metrischen Daten: 50% niedrigere Werte, 50% höhere Werte

  • bei ordinalen Daten: „Medianklasse“ (d.H. in welcher Kategorie 50% erreicht wurden, bezieht sich auf die kummulierten Prozent)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was repräsentiert der Median bei geraden und ungeraden Anzahlen bei Fällen?

A

ungerade Anzahl an Fällen: Median repräsentiert tatsächlich vorhandenen Wert

gerade Anzahl von Fällen: Median ist der halbierte Wert der mittleren beiden Fälle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist der Vorteil eines Medians

A

im Vergleich zum Mittelwert: er ist relativ robust gegen Ausreißer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist der Mittelwert?

A

Gängiges Maß zur durchschnittlichen Berechnung von Ergebnissen.

Immer auch die Standardabweichung erwähnen!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist ein Nachteil beim Mittelwert?

A

Mittelwert ist anfällig für Ausreißer und kann bei Extremwerten und bei asymmetrischen Verteilungen verzerrt
sein.
Daher bei Verzerrungen innerhalb der Daten besser Median verwenden!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist ein Streuungsmaß?

A

Charakterisierung der Variabilität eines Merkmals anhand der Heterogenität/Homogenität der Verteilungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nenne die unterschiedlichen ordinalen Streuungsmaße?

A
  • Min, Max., Range

- Quartile und Quartilabstand

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Beschreibe Minimum, Maximum und Range.

A
  • Range (Spannweite) ist die Differenz zwischen dem größten (max.) und kleinsten (min.) Messwert innerhalb der Verteilung.
17
Q

Was ist ein Quartil?

A
  • Quartile bilden Schnittpunkte zw. den Vierteln einer Verteilung
  • Teilt man eine Verteilung in Quartile, trennen diese die oberen und unteren 25% von den mittleren 50% der Verteilung.
18
Q

Was ist ein Quartilabstand?

A

= Interquartilsbereich:

  • die mittleren 50% der Verteilung (zwischen dem 1. und 3. Quartil bzw. 25 und 75 %) d.H. die unteren und oberen 25% der Verteilung werden ignoriert.

Der Wert ist wiederum (ähnlich wie der Median) eher bei extremen Verteilungen relevant.

  • Analysegrafik: Boxplot
19
Q

Was ist die metrische Streuungsmaße?

A

= berücksichtigen alle Messwerte der Verteilung (nicht nur zwei Messwerte wie bei Quartilsabstand und Range)

20
Q

Was beinhaltet die metrische Streuungsmaße?

A
  • Varianz

- Standardabweichung

21
Q

Beschreibe die Varianz?

A
  • Kann nicht interpretiert werden.
  • Würde man die Summe der Abweichungen jedes einzelnen Messwertes vom arithmetischen Mittelwert berechnen, würde man 0 erhalten -> daher für Varianzberechnung - quadrierten Abweichungen.

Varianz = Vor(berechnungs)stufe der Standardabweichung.

22
Q

Beschreibe die Standardabweichung!

A
  • Wurzel aus der Varianz
  • Kennwert in der Einheit der Variable (wie z.B. Skalenpunkte, Alter, …)
  • exakte Aussage bzw. Beurteilung über Streuung nur durch Vergleich von Verteilungen mit gleicher Skalierung.
  • weil je nach Skalierung der Variable unterschiedlich große Streuungswerte entstehen.
23
Q

Welche Formen von Verteilungen gibt es?

A
  • Verteilung in Bezug auf theoretische Verteilungen (Normalverteilung)
  • Abstraktion: von konkreter Verteilung zu „Verteilungstypen“
  • nur für metrisches Skalenniveau
24
Q

Welche Faustregeln der Interpretation gibt es?

A
  • Standardfehler (Standard Error) verdoppeln
  • Wert mit Wölbung (Kurtosis) bzw. Schiefe (Skewness) vergleichen

Interpretation:
- „signifikant“, wenn
Wert höher als ihr verdoppelter Standardfehler von der Normalverteilung (sonst normalverteilt)

  • „starke Streuung“ nur
    bei flacher Wölbung
  • Vorzeichen (spielt beim Vergleich mit dem Standardfehler keine Rolle
25
Was verursachen die Vorzeichen bei einer Verteilung?
+ rechtsschief bzw. linkssteil ->steile Wölbung - linksschief bzw. rechtssteil -->flache Wölbung
26
Was ist bei schiefen Verteilungen zu beachten?
- kennzeichnen Modus und Median die zentrale Tendenz häufig besser als das arithmetische Mittel. - Ausreißer“ beeinflussen den Mittelwert stärker als Median oder Modus
27
Inwiefern ist die Normalverteilung von Bedeutung?
- sozialwissenschaftliche Daten weichen häufig vom Ideal der symmetrischen Verteilung ab. - biologische, naturwissenschaftlichen Daten (wie Körpergröße, ‐gewicht, IQ, ...) sind meist normalverteilt (d.H. unimodal und symmetrisch)
28
Was sind die Eigenschaften einer Normalverteilung?
- Glockenförmiger Verlauf - Symmetrische Verteilung - Modus, Median und Mittelwert fallen zusammen und bilden Gipfel der Verteilung - Verteilung nähert sich asymptotisch der x‐Achse
29
Warum sind Häufigkeitsverteilungen von Bedeutung?
Häufigkeitstabellen sind eine Strategie, eine Übersicht über die Daten zu bekommen. Man erhält eine Auszählung, wie häufig die Messwerte pro Ausprägung waren. Werte können erst ab Ordinalskalenniveau interpretiert werden.
30
Wie wird die Häufigkeit dargestellt?
- Bei ungleichen Klassenbreiten erfolgt die Darstellung der Häufigkeit nicht mehr über die Höhe der Balken, sondern über die Fläche. - Für jede Klasse muss die Höhe des zu errichtenden Balkens errechnet werden (Häufigkeit/Klassenbreite = Häufigkeitsdichte). - Im SPSS besteht keine Möglichkeit, Klassen unterschiedlicher Breite zu definieren. Darstellung der Häufigkeit über die Höhe ist somit nur bei gleichen Klassenbreiten möglich.
31
Was ist die Kategorienbildung?
Zusammenfassen von Ausprägungen oder Wertebereichen
32
Nach welchen Kategorien soll eingeteilt werden?
Setzung der Klassengrenzen bzw. welche Ausprägungen sollen gruppiert werden? • Kategorienbildung bei unterschiedlichen Skalenniveaus: o Nominal: inhaltlich ähnlich o Ordinal: benachbarte Ausprägungen o Metrisch: Wertebereiche (Intervalle)
33
Wieviele Kategorien sollen gebildet werden?
Inhaltliche Kriterien: häufig ergeben sich natürliche Grenzen (z.B. Aufenthaltsdauer in Wochen, Ausbildungs‐, Pensionsgrenzen bei Alter) o Formale Kriterien: Gleiche Klassenbreite bei metrischen Daten; in den Klassen sollten auch annähernd gleiche Häufigkeiten sein