Aufgaben Flashcards

1
Q

Geben Sie ein einfaches Beispiel an, bei dem einer Bestandsmasse mehrere korrespondie- rende Ereignismassen zugeordnet sind.

A

Lagerbestand (Bestandsmasse) ↔ Anlieferung, Verkauf, Diebstahl (Ereignissmassen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welche Probleme ergeben sich bei der Messung stetiger Merkmale?

A

endliche Messgenauigkeit ist jedes theoretisch stetige Merkmal in der praktischen Anwendung letztlich diskret

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Eine Fortschreibung ist sinnvoll, wenn

A
  1. die Bestandsmasse gegenüber den korrespondierenden Ereignismassen sehr gross ist bzw. die Ereignismassen ohnehin erhoben werden.
  2. die letzte Neuerfassung der Bestandsmasse noch nicht zu lange zurückliegt (→ Gefahr der Fehlerakkumulation).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Eine Missachtung der Skalenart kann zu folgenden Problemen führen:

A
  • Überinterpretation bzw. Informationsverlust bei Wechsel zwischen den Skalen
  • Verlust bzw. Verfälschung der Aussagekraft von Messwerten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Merkmalsart (Bsp.: Telefonnummer eines Faxgerätes)

A

qualitativ/quantitativ? Skalenniveau?

Bsp.: qualitatives Merkmal bzw. Nominalskala/nicht häufbar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Erläutern Sie, wie das häufbare Merkmal ”zusätzliche Fächer“ der statistischen Einheiten ”Studierende des Wirtschaftsingenieurwe-sens“ auf ein nicht häufbares zurückgeführt werden kann.

A

(Bildung der Potenzmenge)
häufbares Merkmal mit n Ausprägungen → nicht häufbares Merkmal mit 2^n Ausprägungen
Hier: Ausprägungen ∈ P({Statistik, Informatik, OR})

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

{Merkmalsausprägung vs. Merkmalswert}

Wiederholung?

A

Eine Liste der Merkmalsausprägungen enthält sinnvollerweise keine Wiederholungen. Eine Liste der Merkmalswerte (die Urliste) wird meist Wiederholungen aufweisen, da statistische Einheiten übereinstimmende Merkmalswerte haben können.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Summenhäufigkeitsfunktion bei klassierten Daten - implizite Annahme:

A

Gleichverteilung innerhalb der Klassen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Die relative Summenhäufigkeitsfunktion stimmt nicht mit der empirischen Verteilungsfunktion überein, sondern ist nur eine Näherung dieser.

A

wahr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Summe der relativen Häufigkeiten = 1 bei einer Erhebung - gibt es Ausnahmen?

A

Ausnahmen sind bei häufbaren Merkmalen möglich, z. B. erlernter Beruf

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

kombiniertes Flächen- /Kreissektorendiagramms - Alternativen

A

gestapeltes Balkendiagramm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Problem offener Randklassen

A

entweder fehlende Klassengrenze ”sinnvoll“ ergänzen oder Höhe des Rechtecks beträgt 0 und Vermerk in der
Grafik oder Legende zur Grafik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Häufigkeitspolygon - Problem Randklassen

A
  1. Polygonzug endet an den Randklassen → wirkt unvollständig.
  2. Einführung zweier neuer Randklassen mit h(I) = 0 → Gefahr der Fehlinterpretation.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie lässt sich die Summenhäufigkeitsfunktion interpretieren?

A

Die Summenhäufigkeitsfunktion kann als Näherung der empirischen Verteilungsfunktion interpretiert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Berechnung aus den klassierten Daten Lageparameter und die Varianz. Welche Annahmen treffen Sie dabei?

A

Die Berechnung der Lage- und Streungsparameter beruht auf der Annahme, dass die Klassenmitten als Repräsentant für die Klassen geeignet sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Klassierte Daten - Aussage Spannweite

A

geringe Aussagekraft, da über die Wahl der Klassengrenzen manipulierbar!

17
Q

Lageparameter und Varianz in klassierten und unglasierten Daten - Vergleich

A

Zentralwert bei den Ausgangsdaten und feinberechneter Zentralwert bei den klassierten sind gleich.
Es gibt Abweichungen bei den übrigen Lageparametern, da die Verteilung in den Klassen nicht gleichmäßig ist, die Klassenmitten zI also keine perfekten Repräsentanten sind.
Die aus den klassierten Daten berechnete Varianz ist tendenziell niedriger, da die Streuung innerhalb der Klassen vernachlässigt wird.

18
Q

Der Median minimiert d(m).

A

d = Mittlere absolute Abweichung vom Zentralwert xz (=m)

wahr

19
Q

Je größer Herfindahl-Index, desto …

A

… größer ist die Konzentration.

20
Q

Wie ändern sich Lorenzkurve und Ginikoeffizient, wenn der Gesetzgeber die Einkommen folgendermaßen besteuert:

(i) Kopfsteuer von 500 pro Gehaltsempfänger und Monat
(ii) Proportionalsteuer von 30% auf das monatliche Bruttogehalt
(iii) progressive Besteuerung mit den entsprechenden Steuersätzen der Einkommensklassen

A

Proportionalsteuer hat keinen Einfluss auf G;
Kopfsteuer vergrößert die Konzentration;
progressive Steuer vermindert die Einkommensdivergenz eher (gemessen jeweils durch den Gini-Koeffizient).

21
Q

Wie würden sich die Lorenzkurve und der Gini-Koeffizient ändern, wenn die Klassen paarweise (Klasse 1 und 2, Klasse 3 und 4 usw.) zusammengefasst würden?

A

Sind zwei verschiedene Klasseneinteilungen hierarchisch angeordnet, d.h. ist die eine eine Verfeinerung der anderen (wie im vorliegenden Fall) so interpoliert die Lorenzkurve der gröberen Klasseneinteilung diejenige der feineren.

22
Q

6 Birnen brannten am Ende des 24 Stunden-Tests noch immer.

Bei der Erstellung eines Boxplots bzw. Histogramms Probleme?

A

Jede der vier Möglichkeiten ist willkürlich und damit problematisch.

23
Q

Kontingenztabelle Darstellung

A

Darstellung wäre z.B. durch ein 3-dimensionales Stab-/ Balkendiagramm möglich. Eine 2-dimensionale Darstellung ist möglich, wenn die absolute/ relative Häufigkeit durch Grautöne, Farben oder Schraffur dargestellt werden.

24
Q

Können Sie die Unabhängigkeit auch mit Hilfe eines gestapelten Balkendiagramms {Flächen-/Kreissektorendiagramm} überprüfen?

A

bei Unabhängigkeit ist die Struktur der Balken (Grössenverhältnisse der Balkenabschnitte) {die Winkel} gleich.

25
Q

Nachteil des unkorrigierten Kontingenzmaßes

A

Der größte mögliche Wert ist abhängig von der Anzahl der Merkmalsausprägungen der beiden Merkmale.
⇒ kein direkter Vergleich verschiedener unkorrigierter Kontingenzkoeffizienten möglich.

26
Q

funktionaler Zusammenhang bei Ergebnissen

A
  • Ursache – Wirkung – Interpretation (häufig) nicht zulässig
  • Interpretation von ε: Abweichung der Punkte vom linearen Zusammenhang wegen nicht beobachteter Einflussfaktoren und Zufall (”Tagesform“).
27
Q

Werte/Ausprägungen prognostizieren

A

Anhand der berechneten Regressionsgeraden können Prognosen erstellt werden.

28
Q

Warum Vertrauen in Reggressionsgerade unrealistisch?

A

Die Modellbeziehung geht von einer unbegrenzten Marktnachfrage aus (realistisch: Marktsättigung).

29
Q

g: linearen Regression von y auf x und

g′: linearen Regression von x auf y sind nicht identisch.

A

bei einer Regression von y auf x (y = m x+b) die senkrechten Abstände der Punkte von der Geraden in die Summe der quadrierten Abweichungen, bei einer Regression von x auf y (x = m′ y+b′) die waagerechten Abstände eingehen

30
Q

Je größer der Anstieg der Regressionsgeraden, desto größer ist der Korrelationskoeffizient.

A

falsch

31
Q

Ist der Anstieg der Regressionsgeraden positiv, so ist auch der Korrelationskoeffizient positiv.

A

wahr

32
Q

Das Bestimmtheitsmaß wird mit wachsender Anzahl der Beobachtungen größer.

A

Falsch, Gegenbeispiel: Fu ̈r n = 2 gilt stets r2 = 1, fu ̈r n > 2 i.a. nicht (falls keine perfekte Korrelation vorliegt)

33
Q

Ist das Bestimmtheitsmaß gleich 1, so sind alle Residuen gleich 0.

A

Richtig: Wenn r^2 = 1 gilt, liegt perfekte Korrelation vor (also alle beobachteten Werte liegen auf der Regressionsgeraden)

34
Q

Ist der Korrelationskoeffizient gleich 0, so liegen alle Beobachtungswerte auf einer waagerechten Geraden.

A

Falsch: r = 0 bedeutet, dass die betrachteten Merkmale unkorreliert sind.

35
Q

Ist der Korrelationskoeffizient gleich 0, so sind die Merkmale X und Y unabhängig.

A

Falsch: r = 0 bedeutet, dass die betrachteten Merkmale unkorreliert sind.

36
Q

Implikation Unabhängigkeit und Unkorreliertheit

A

Unabhängigkeit ⇒ Unkorreliertheit,

Unkorreliertheit !⇒ Unabhängigkeit