Teilprüfung 1 Flashcards
(63 cards)
Was ist eine Urliste
Ungeordnete Auflistung aller vorhandenen Daten
In der Tabelle:
Eine Spalte entspricht einer Variablen.
Eine Zeile entspricht einem Objekt.
Sie beinhaltet die gemessenen Variablenwerte eines einzelnen Objekts. Die Werte einer Zeile nennt man auch Datensatz.
Was ist der Unterschied zwischen Grundgesamtheit und Stichprobe (Teilgesamtheit)?
Eine Grundgesamtheit (Population) umfasst eine bestimmte Menge von Objekten.
Werden Teile einer Grundgesamtheit in eine eigene Menge gepackt ist es eine Teilgesamtheit.
-> Selektion bestimmter Zeilen aus der Urliste
Spaltenname (Merkmale) bleiben unverändert
Welche Skalen gibt es?
Intervallskala:
Es gibt keinen natürlichen Nullpunkt. Jedoch lassen sich die Unterschiede messen; beispielsweise eine in Celsius gemessene Temperatur: 6 Grad ist nicht doppelt so warm wie 3 Grad. Aber der Temperaturunterschied von 6 auf 3 Grad Celsius ist genauso groß wie von 44 auf 41 Grad.
Verhältnisskala:
Es gibt einen natürlichen Nullpunkt.
Beispiele: Gewicht, Bargeld, Volumen.
Welche Variablen gibt es?
qualitative Variable:
quantitative Variable:
Hierbei unterscheidet man:
diskret:
stetig:
nominale Variable:
ordinale Variable
metrische Variable
Was ist die qualitative Variable?
qualitative Variable:
Sie wird auch artmäßiges Merkmal genannt.
Beispiele: Farbe, Postleitzahl, Stadtteil, Zustand, Steuerklasse, Geschlecht, Familienstand.
quantitative Variable
quantitative Variable:
Sie wird auch zahlmäßiges Merkmal genannt. Hierbei unterscheidet man:
diskret:
Es können nur bestimmte, separate Werte angenommen werden.
Beispiele:
Anzahl Kinder pro Familie, Eintrittspreis im Theater, Anzahl der Krankmeldungen an einem Tag.
stetig:
Die Werte sind auf einer kontinuierlichen Skala darstellbar.
Das heißt, dass zwischen zwei Merkmalswerten unendlich viele weitere Werte denkbar wären. Ist auf beliebig viele Nachkommastellen messbar
Beispiel: Volumen, Gewicht, Zeit, Länge, Temperatur.
nominale Variable:
Es gibt keine natürliche Ordnung, wie zum Beispiel bei dem Merkmal Farbe mit den Merkmalswerten rot, gelb, blau, grün
ordinale Variable:
Es gibt eine Rangfolge bzw. Ordnung unter den Werten der Variablen, wie zum Beispiel bei der Variablen Zustand: sehr gut, gut, normal, schlecht.
metrische Variable:
- quantitative Variablen
- besitzen eine Ordnung und man kann nicht nur sagen das ein Wert größer ist als ein anderen sondern auch wie groß der Abstand zwischen den Werten ist
Unterschieden wird zwischen:
Intervallskala:
Es gibt keinen natürlichen Nullpunkt. Jedoch lassen sich die Unterschiede messen; beispielsweise eine in Celsius gemessene Temperatur: 6 Grad ist nicht doppelt so warm wie 3 Grad. Aber der Temperaturunterschied von 6 auf 3 Grad Celsius ist genauso groß wie von 44 auf 41 Grad.
Verhältnisskala:
Es gibt einen natürlichen Nullpunkt. Beispiele: Gewicht, Bargeld,
Volumen.
Was sind absolute Häufigkeiten?
ist die absolute Anzahl, wie oft ein Ereignis bei einem Experiment auftritt.
Was sind relative Häufigkeiten?
Die relative Häufigkeit gibt den Anteil am Stichprobenumfang an, mit der ein Merkmal auftritt.
Die relative Häufigkeit wird mithilfe der absoluten Häufigkeit berechnet.
Was sind kumulierte Häufigkeiten?
auch Summenhäufigkeit,
gibt die Häufigkeit an, dass ein Merkmal kleiner gleich einem bestimmten Wert k ist.
Es handelt sich also um die Summe aus der Häufigkeit dieses Werts mit den Häufigkeiten aller Werte darunter.
Wie kann man die absolute Häufigkeit darstellen?
in ganzen Zahlen
Bsp. Vierfeldertafel
Wie kann man die relative Häufigkeit darstellen?
als Prozent oder in ganzen Zahlen
Bsp. Balkendiagramm
Wie kann man die kumulierte Häufigkeit darstellen?
als Prozent oder in ganzen Zahlen
Was sind Säulen-, Stab-, Balkendiagramme?
grafischen Darstellung der Häufigkeit von Ausprägungen beliebig skalierter Merkmale
absolute/relative Häufigkeit
Was ist die empirische (kumulative) Verteilungsfunktion?
Wahrscheinlichkeitsvereilung wird untersucht
Zusammenhang zwischen Zufallsvariable und ihrer Wahrscheinlichkeit wird beschrieben
F(x)=P(X≤x)
was ist ein Histogramm?
eine spezielle Form des Säulendiagramms, wird zur Darstellung von Häufigkeitsverteilungen bei statistischen Daten verwendet
Was ist ein Boxplot?
besteht aus vier Bereichen
Box hat 50%, diese ist durch den Median getrennt
Striche nach lins oder rechts (oben/unten) haben jeweils 25%
kann sein das neben den Strichen noch Punkte sind da sie nur eine gewisse länge haben dürfen (1.5-Fache des Interquartilsabstandes)
Was sind arithmetischer Mittelwert (Mittel)?
ist ein Lageparameter in der Statistik
wird auch als Durchschnittswert bezeichnet.
Es ist nur bei metrischen Variablen anwendbar.
Berechnet wird er, indem man die Summe aller betrachteten Zahlen durch deren Anzahl teilt.
Was ist ein getrimmtes Mittel ?
ist dem arithmetischen Mittel sehr ähnlich.
Bei ihm wird jedoch ein bestimmter Anteil der größten und kleinsten Stichprobenelemente ignoriert.
Dadurch fallen Stichprobenelemente, die weit vom tatsächlichen Mittelwert entfernt liegen, nicht so stark ins Gewicht.
Was ist der Median?
Variablenwert,
Teilt Grundgesamtheit in zwei gleich große Hälften.
Dabei liegen in der einen Hälfte die Objekte mit den größeren Variablenwerten und in der anderen Hälfte die Objekte mit den kleineren Variablenwerten.
Was sind Ränge?
oder auch Rangstatistiken
bezeichnen nach der Größe sortierte Stichproben
kleinste Wert Minimum
größte Wert Maximum
Was sind Quantile?
Umkehrfunktion von Rängen
Geeignet sich zur Beantwortung folgender Fragen:
„Größer als welcher Wert sind ein Viertel der Stichprobe?“
Vorhandenen Daten aus der Frage können in zwei Teile getrennt werden
Datensatz muss der größe nach geordnet sein (Ordinalskala)