statistik Flashcards
(66 cards)
Die statistischen Einheiten müssen
sachlich, räumlich und
zeitlich voneinander abgegrenzt werden und somit eindeutig
identifizierbar sein.
Als Merkmal wird eine
Eigenschaft einer statistischen Einheit
bezeichnet, die in der statistischen Analyse betrachtet wird.
Die Werte oder Kategorien, die ein Merkmal annehmen kann,
werden als
Merkmalsausprägungen bezeichnet.
Eine an einer bestimmten statistischen Einheit festgestellte
Merkmalsausprägung wird .
Merkmalswert oder Beobachtungswert genannt
Eine Nominalskala unterscheidet Merkmale nur nach
Gleichheit oder Verschiedenheit. Es existiert keine Rangordnung.
Eine Ordinal- oder Rangskala liegt vor, wenn
die Merkmalswerte neben der qualitativen Unterschiedlichkeit eine natürliche
Rangordnung besitzen.
Besitzt ein Merkmal die Eigenschaften eines ordinalen Merkmals
und ist zusätzlich noch die Interpretation der Abstände zweier verschiedener Merkmalsausprägungen möglich, so
kann das
Merkmal auf einer metrischen Skala (Kardinalskala) gemessen werden.
Ein Merkmal heißt diskret, wenn
es nur endlich viele oder höchstens diskrete
abzählbar unendlich viele Ausprägungen besitzt (nominal skalierte Merkmale
Merkmale; Merkmale, deren Wert durch Zählen bestimmt wird).
Nominal- und ordinalskalierte Merkmale sind stets diskret.
Dagegen heißt ein metrisches Merkmal stetig (kontinuierlich), wenn
stetige
es überabzählbar viele Ausprägungen hat, d.h. wenigstens in einem Merkmale
bestimmten Bereich können unendlich viele Werte angenommen werden.
Z.B. wird das Merkmal Einkommen als stetiges Merkmal behandelt, da
es in Berechnungen mit vielen Nachkommastellen eingeht und somit
überabzählbar viele Ausprägungen vorliegen können. Die tatsächliche
Angabe erfolgt dagegen meistens nur mit zwei Nachkommastellen.
Ebenso kann das Merkmal Wohnfläche auf viele Nachkommastellen
gemessen werden, wobei oft nur ganze m2 angegeben werden.
Eine Skalentransformation kann als
Abbildung von einer
Menge Merkmalsausprägungen in eine anderere Menge Merkmalsäusprägungen angesehen werden. Dabei ist zu beachten,
dass die Ordnungseigenschaften der Skala erhalten bleiben.
Je nach Skalenniveau sind verschiedene Transformationen zulässig, d.h.
durch die Transformation darf keine Information verloren gehen.
Bei einer eineindeutigen Skalentransformation, wird
jedem
Wert der alten Skala genau ein Wert der neuen Skala (und umgekehrt) zugeordnet.
Eine monotone Skalentransformation liegt vor, wenn
die
Rangordnung der Skalenwerte erhalten bleibt.
Lineare Skalentransformationen nutzen
lineare Funktionen
der Form y = a+bx, wobei das Verhältnis der Abstände zwischen
den Skalenwerten erhalten bleibt.
Die Klassierung von Merkmalsausprägungen stellt eine
Zusammenfassung benachbarter Merkmalsausprägungen zu einer
Klasse dar, wobei die vorgegebene Ordnung erhalten bleibt. Dabei sollten disjunkte Klassen mit möglichst gleicher Breite (Ausnahme: Randklassen) ausgewählt werden.
Für diskrete Merkmale gilt als Faustregel, dass bei Vorliegen von n Merkmalswerten die Anzahl der Klassen √
n betragen soll. Die Gesamtzahl der
Klassen sollte aufgrund der Übersichtlichkeit die Zahl 20 nicht überschreiten. Eine Klasse wird mittels der
Klassengrenzen, der Klassenbreite
und der Klassenmitte eindeutig festgelegt.
Als offene Randklasse wird die
erste oder letzte der geordneten
Klassen bezeichnet, wenn keine untere bzw. obere Klassengrenze
vorhanden ist.
Liegt eine statistische Reihe vor, deren Beobachtungen aus nur einem
Merkmal bestehen, so wird eine eindimensionale (univariate) Häufigkeitsverteilung aufgestellt.
mehrdimensionale
Häufigkeitsvtlg.
Eine mehrdimensionale (multivariate) Häufigkeitsverteilung
ergibt sich, wenn
mehrere Merkmale gleichzeitig betrachtet werden.
Ein Stab- bzw. Säulendiagramm veranschaulicht
bei Vorliegen
einer horizontalen Achse eine höhenproportionale Darstellung der
Häufigkeiten mittels Stäben bzw. Säulen.
Balkendiagramme besitzen eine vertikale Achse mit waagerecht
aufgetragenen Balken (längenproportionale Darstellung).
bei Vorliegen
einer horizontalen Achse eine höhenproportionale Darstellung der
Häufigkeiten mittels Stäben bzw. Säulen.
Balkendiagramme besitzen eine
vertikale Achse mit waagerecht
aufgetragenen Balken (längenproportionale Darstellung).
Ein Liniendiagramm/Kurvendiagramm ist eine
grafische Darstellung von Messzahlen oder Indexzahlen in einem Koordinatensystem durch Kurven bzw. geradlinig verbundene Punkte.
Ein Histogramm ist eine
grafische Darstellung der Häufigkeiten eines klassierten, quantitativen Merkmals durch rechteckige Flächen
über den Klassen in einem Koordinatensystem. Es ist zu beachten,
dass die einzelnen Rechtecke des Histogramms unmittelbar aneinander schließen und nicht wie beim Säulendiagramm getrennt sind.
Wird eine Nominalskala vorausgesetzt, bei der keine natürliche oder Nominalskala
vorgegebene Ordnung vorliegt, bieten sich
Flächendiagramme in Form
eines Kreisdiagramms an. Hierbei lässt sich am besten illustrieren, wie
die Gesamtzahl auf die einzelnen Ausprägungen aufgeteilt ist. Auch
Säulen-, Stab- und Balkendiagramme sind geeignete Darstellungsmöglichkeiten
Liegt eine Ordinalskala vor, wird in der Regel auf
Säulen-, Stab- und Ordinalskala
Balkendiagramme zurückgegriffen, wobei auch hier Flächendiagramme
sinnvoll verwendet werden können.