Methoden der Erhebung und Aufbereitung Flashcards
(7 cards)
Metrische Variablen
(klasseneinteilung) Bei vielen beobachteten Ausprägungen ist eine Klasseneinteilung sinnvoll, also eine Zerlegung des Bereichs in Klassen.
Häufigkeiten
Als absolute bzw relative Häufigkeit einer Ausprägung bezeichnet man die Anzahl bzw den Anteil von Werten der Urliste.
Grafische Darstellungen
Säulen-, Balken- und Kreisdiagramme sind nur geeignet, wenn die Anzahl der möglichen Ausprägungen nicht zu groß ist.
Für metrische Merkmale mit vielen verschiedenen Werten sind diese sehr unübersichtlich. Für solche Daten eignen sich eher das Stamm-Blatt-Diagramm und das Histogramm.
Beim Histogramm wählt man für die Gruppierung als Klassen…
… benachbarte Intervalle.
DieRechteck-Fläche über den Intervallen ist gleich oder proportional zu den relativen bzw absoluten Häufigkeiten.
∙Fläche=BreitexHöhe
∙Klassenbreite:dj=cj-cj-1
∙Höhe:gleich oder proportional zu hj/dj bzw fj/dj
∙Fläche:gleich oder proportional zu hj bzw fj
Empirische Verteilungsfunktion
Die empirische Verteilungsfunktion beantwortet dieFragestellung:“ Welcher Anteil der Daten ist kleiner oder gleich einem Wert x?“
(Vss: zumindest Ordinalskala)
→Absolute oder relative Häufigkeiten bis x aufsummieren
→Absolute/relative kumulierte Häufigkeitsverteilung (Anzahl Beobachtungen, die kleiner oder gleich x)
Approximationen
Statt Histogrammen, die an den Klassenrändern Unstetigkeiten aufweisen, können auch Approximationen verwendet werden. Stetige Schätzer für Dichtekurven erhält man, indem man statt des Rechteckkerns stetige Kerne zulässt, mit denen sich Dichtefunktionen dann durch sog Kern-Dichte-Schätzerapproximieren.
∙Epanechnikov-Kern
∙Bisquare-Kern
∙Gauß-Kern
Zweidimensionale Häufigkeitsverteilungen
Bei zweidimensionalen Häufigkeiten wird nicht nur eine Variable X betrachtet, sondern gleichzeitig auch eine zweite Variable Y.