Aufgaben Flashcards
(36 cards)
Geben Sie ein einfaches Beispiel an, bei dem einer Bestandsmasse mehrere korrespondie- rende Ereignismassen zugeordnet sind.
Lagerbestand (Bestandsmasse) ↔ Anlieferung, Verkauf, Diebstahl (Ereignissmassen)
Welche Probleme ergeben sich bei der Messung stetiger Merkmale?
endliche Messgenauigkeit ist jedes theoretisch stetige Merkmal in der praktischen Anwendung letztlich diskret
Eine Fortschreibung ist sinnvoll, wenn
- die Bestandsmasse gegenüber den korrespondierenden Ereignismassen sehr gross ist bzw. die Ereignismassen ohnehin erhoben werden.
- die letzte Neuerfassung der Bestandsmasse noch nicht zu lange zurückliegt (→ Gefahr der Fehlerakkumulation).
Eine Missachtung der Skalenart kann zu folgenden Problemen führen:
- Überinterpretation bzw. Informationsverlust bei Wechsel zwischen den Skalen
- Verlust bzw. Verfälschung der Aussagekraft von Messwerten
Merkmalsart (Bsp.: Telefonnummer eines Faxgerätes)
qualitativ/quantitativ? Skalenniveau?
Bsp.: qualitatives Merkmal bzw. Nominalskala/nicht häufbar
Erläutern Sie, wie das häufbare Merkmal ”zusätzliche Fächer“ der statistischen Einheiten ”Studierende des Wirtschaftsingenieurwe-sens“ auf ein nicht häufbares zurückgeführt werden kann.
(Bildung der Potenzmenge)
häufbares Merkmal mit n Ausprägungen → nicht häufbares Merkmal mit 2^n Ausprägungen
Hier: Ausprägungen ∈ P({Statistik, Informatik, OR})
{Merkmalsausprägung vs. Merkmalswert}
Wiederholung?
Eine Liste der Merkmalsausprägungen enthält sinnvollerweise keine Wiederholungen. Eine Liste der Merkmalswerte (die Urliste) wird meist Wiederholungen aufweisen, da statistische Einheiten übereinstimmende Merkmalswerte haben können.
Summenhäufigkeitsfunktion bei klassierten Daten - implizite Annahme:
Gleichverteilung innerhalb der Klassen
Die relative Summenhäufigkeitsfunktion stimmt nicht mit der empirischen Verteilungsfunktion überein, sondern ist nur eine Näherung dieser.
wahr.
Summe der relativen Häufigkeiten = 1 bei einer Erhebung - gibt es Ausnahmen?
Ausnahmen sind bei häufbaren Merkmalen möglich, z. B. erlernter Beruf
kombiniertes Flächen- /Kreissektorendiagramms - Alternativen
gestapeltes Balkendiagramm
Problem offener Randklassen
entweder fehlende Klassengrenze ”sinnvoll“ ergänzen oder Höhe des Rechtecks beträgt 0 und Vermerk in der
Grafik oder Legende zur Grafik.
Häufigkeitspolygon - Problem Randklassen
- Polygonzug endet an den Randklassen → wirkt unvollständig.
- Einführung zweier neuer Randklassen mit h(I) = 0 → Gefahr der Fehlinterpretation.
Wie lässt sich die Summenhäufigkeitsfunktion interpretieren?
Die Summenhäufigkeitsfunktion kann als Näherung der empirischen Verteilungsfunktion interpretiert werden.
Berechnung aus den klassierten Daten Lageparameter und die Varianz. Welche Annahmen treffen Sie dabei?
Die Berechnung der Lage- und Streungsparameter beruht auf der Annahme, dass die Klassenmitten als Repräsentant für die Klassen geeignet sind.
Klassierte Daten - Aussage Spannweite
geringe Aussagekraft, da über die Wahl der Klassengrenzen manipulierbar!
Lageparameter und Varianz in klassierten und unglasierten Daten - Vergleich
Zentralwert bei den Ausgangsdaten und feinberechneter Zentralwert bei den klassierten sind gleich.
Es gibt Abweichungen bei den übrigen Lageparametern, da die Verteilung in den Klassen nicht gleichmäßig ist, die Klassenmitten zI also keine perfekten Repräsentanten sind.
Die aus den klassierten Daten berechnete Varianz ist tendenziell niedriger, da die Streuung innerhalb der Klassen vernachlässigt wird.
Der Median minimiert d(m).
d = Mittlere absolute Abweichung vom Zentralwert xz (=m)
wahr
Je größer Herfindahl-Index, desto …
… größer ist die Konzentration.
Wie ändern sich Lorenzkurve und Ginikoeffizient, wenn der Gesetzgeber die Einkommen folgendermaßen besteuert:
(i) Kopfsteuer von 500 pro Gehaltsempfänger und Monat
(ii) Proportionalsteuer von 30% auf das monatliche Bruttogehalt
(iii) progressive Besteuerung mit den entsprechenden Steuersätzen der Einkommensklassen
Proportionalsteuer hat keinen Einfluss auf G;
Kopfsteuer vergrößert die Konzentration;
progressive Steuer vermindert die Einkommensdivergenz eher (gemessen jeweils durch den Gini-Koeffizient).
Wie würden sich die Lorenzkurve und der Gini-Koeffizient ändern, wenn die Klassen paarweise (Klasse 1 und 2, Klasse 3 und 4 usw.) zusammengefasst würden?
Sind zwei verschiedene Klasseneinteilungen hierarchisch angeordnet, d.h. ist die eine eine Verfeinerung der anderen (wie im vorliegenden Fall) so interpoliert die Lorenzkurve der gröberen Klasseneinteilung diejenige der feineren.
6 Birnen brannten am Ende des 24 Stunden-Tests noch immer.
Bei der Erstellung eines Boxplots bzw. Histogramms Probleme?
Jede der vier Möglichkeiten ist willkürlich und damit problematisch.
Kontingenztabelle Darstellung
Darstellung wäre z.B. durch ein 3-dimensionales Stab-/ Balkendiagramm möglich. Eine 2-dimensionale Darstellung ist möglich, wenn die absolute/ relative Häufigkeit durch Grautöne, Farben oder Schraffur dargestellt werden.
Können Sie die Unabhängigkeit auch mit Hilfe eines gestapelten Balkendiagramms {Flächen-/Kreissektorendiagramm} überprüfen?
bei Unabhängigkeit ist die Struktur der Balken (Grössenverhältnisse der Balkenabschnitte) {die Winkel} gleich.