QMII Flashcards Preview

Mathe > QMII > Flashcards

Flashcards in QMII Deck (56):
1

nominal skaliert

ohne implizierte Reihenfolge
kein besser oder schlechter

z.B.: Augenfarbe, Geschlecht

2

ordinal skaliert

mit implizierter Reihenfolge,
aber mit nicht messbaren Abständen

z.B.: Zufriedenheit, Wichtigkeit

3

metrisch skaliert

mit implizierter Reihenfolge und
messbaren Abständen

z.B.: Kundenzahl,

4

Welcher Beobachtungswert (xp) wird von X% der Befragten nicht überschritten?

xp heißt p-Quantil oder Prozentpunkt

5

Wie viel Prozent der Befragten haben höchstens den Beobachtungswert xp angegeben?

F(x) heißt Anteilswert

6

B c A

B ist Teilmenge von A
Jedes Ergebnis aus B ist auch in A enthalten

c "andersrum" = Obermenge

7

A n B


Durchschnitt (Schnittmenge) von A und B
Jedes Ergebnis, dass sowohl in A als auch in B vorkommt

8

A u B

Vereinigung von A und B
A oder B oder beides

9

A \ B

= A n NichtB
A aber nicht B

10

Zwei Ereignisse A und B heißen stochastisch unabhängig, wenn gilt

P(A | B) = P(A)

P(X, Y) = P(X) · P(Y)

Aus Arbeitstabelle berechenbar:
Wert/Spaltensumme = Zeilensumme

11

Modus

häufigster oder dichtester Wert

12

Median

50%-Punkt, Zentralwert
für ordinal oder metrisch skalierte Daten
"Welcher Wert wird von 50% überschritten?"

13

xi

Wertangabe bei Befragung

14

ni

Häufigkeit der Wertangabe bei Befragung

15

ni / n

Wahrscheinlichkeit

16

Eine Zufallsvariable heißt diskret, wenn

die Menge der Realisationsmöglichkeiten endlich oder höchstens abzählbar unendlich ist.

17

Eine Zufallsvariable heißt stetig, wenn

jede Zahl aus einem Intervall eine Realisationsmöglichkeit ist

bspw. Körpergröße

18

unimodal

eingipfliger Verteilungsgraph

19

Ist X eine diskrete Zufallsvariable, so lässt sich jede Wahrscheinlichkeit P(X ≤ x) auch über das...

Gegenereignisberechnen: P (X ≤ x )= 1 − P(X > x)

20

Ist für eine diskrete Zufallsvariable X die Wahrscheinlichkeit P(X ≤ x) gesucht, so sollte vor der Berechnung...

überlegt werden, welche der beiden Anzahlen der Summanden geringer ist:
Die Anzahl der Summanden von P(X ≤ x) oder die Anzahl der Summanden von 1 − P(X > x)

21

arithmetisches Mittel

nur für metrisch skalierte Stichproben
Durchschnitt

alle Einzelwerte summieren / Stichprobenumfang
bei klassierten Daten mit Klassenmitte
bei Flügelklassen unmöglich

22

äquidistante Klassen

alle Klassen haben die gleiche Breite

23

Rate / Faktor

Rate in Prozentpunkten
Faktor = 1 + Rate

24

geometrisches Mittel

zur Berechnung der durchschnittlichen Rate mit
n-ter Wurzel(Produkt der n Faktoren)

oder bei klassierten Daten:
n-te Wurzel (Produkte der Klassenmitte^Häufigkeit)

25

harmonisches Mittel

für metrisch skalierte Variablen

26

Theoretischen Lageparametern

liegt keine Stichprobe zugrunde,sondern die Wahrscheinlichkeitsverteilung einer Zufallsvariablen.
Theoretische Lageparameter beschreiben die Position/Lage der theoretischen Verteilung einer Zufallsvariablen (diskret oder stetig) auf der Zahlenskala.

27

Empirische Streuungsparameter geben .... an.

die Stärke der Unterschiede, d.h. die Stärke der Schwankungen in den Daten an.

28

empirische Varianz

Streuungsparameter s²
für metrisch skalierte Variablen
nicht möglich bei Flügelklassen

29

empirische Standardabweichung

Die Wurzel der empirischen Varianz s²

30

Quartilsabstand

x0,75 − x0,25
Streuungsparameter bei Flügelklassen um Schwankung der Daten zu beurteilen
! Funktioniert nicht wenn Quartil in Flügelklasse

31

relativer Quartilsabstand

(x0,75 − x0,25 ) / x0,50

32

Variationskoeffizient

vx = sx / x-Strich
empirische Standardabweichung im Verhältnis zum arithmetischen Mittel

gibt die Streuung eines Datensatzes prozentual vom arithmetischen Mittel an

33

Spannweite

xmax - xmin

Differenz aus größtem und kleinsten angegebenen Wert

34

Erwartungswert

E(x) = Summe (Werte * Wahrscheinlichkeit)

35

Theoretischen Streuungsparametern...

liegt keine Stichprobe zugrunde, sondern die Wahrscheinlichkeitsverteilung einer Zufallsvariablen.

Theoretische Streuungsparameter geben auf der Zahlenskala in etwa die Größe des relevanten Bereichs für die theoretische Verteilung der Zufallsvariablen an.

36

Ist die Varianz einer Zufallsvariablen klein, so

schwanken die Realisationsmöglichkeiten nicht so stark.

37

Varianz Rechenregeln

V[a+bX] = b² * V[X]

V[X+Y] = V[X] + V[Y], falls X,Y stochastisch unabhängig sind.

38

Wird in einer Klausur nach den Schwankungen oder der Streuung einer Verteilung gefragt,

so ist ein Streuungsparameter zu berechnen.

39

univariaten Datensatz

Datensätze, bei denen Beobachtungen aus genau einer Variable vorliegen

40

bivariate Datensätze

das sind Datensätze, bei denen pro Merkmalsträger Beobachtungen aus genau zwei Variablen vorliegen

41

kleine x-Werte gehen sowohl mit kleinen als auch mit großen y-Werten einher

kein linearer Zusammenhang

42

kleine x-Werte gehen einher mit kleinen y-Werten
große x-Werte gehen einher mit großen y- Werten

positiver linearer Zusammenhang

43

kleine x-Werte gehen einher mit großen y-Werten
große x-Werte gehen einher mit kleinen y-Werten

negativer linearer Zusammenhang

44

empirische Kovarianz
bei bivarianten Datensätzen

das arithmetische Mittel der aufsummierten Produkte:
(xi - X-Strich) * (yi - y-Strich)

Gib an, welcher linearer Zusammenhang vorliegt.
Ist nicht für deren Stärke aussagekräftig

45

empirischer Korrelationskoeffizient

rxy = sxy / (sx * sy)

r liegt zwischen -1 und 1

wenn r = +/- 1 liegen alle Punkte genau auf einer Geraden

46

Korrelationsstärke

schwach: -0,5 bis 0,5
mittel: +/- 0,5 bis +/- 0,8
stark: +/- 0,8 bis +/- 1

47

Scheinkorrelation

Beispiel mit Haardichte und Verdienst

48

Regressionsgerade

Die Methode der kleinsten Quadrate legt eine Gerade derart durch die Datenpunkte, dass auf der Senkrechten die Summe der quadrierten Abstände der Datenpunkte von der Geraden minimal ist. Die so erhaltene Gerade wird als Regressionsgerade bezeichnet.

49

Regressionskoeffizienten

Die Koeffizienten a1 und b1 der Regressionsgeraden
f(x) = a1 + b1 * x

50

Regression von Y auf X
mit a1 + b1 * x

Nutzung wenn X bekannt und Y gesucht wird

51

Regression von X auf Y
mit a2 + b2 * x

Nutzung wenn Y bekannt und X gesucht wird

52

interpolierter Wert

Wert befindet sich im Bereich der erhobenen Daten

53

extrapolierter Wert

Wert befindet sich außerhalb des Bereich der erhobenen Daten

54

Kriterien für zuverlässige prognostizierte Werte

Interpolation und starke Korrelation

55

perfekte Korrelation

alle beobachteten Werte liegen auf der Regressionsgerade, würden also auch so vorhergesehen

56

Bestimmtheitsmaß

Angabe in %
"Etwa X% der Gesamtstreuung wird erklärt durch die Streuung der Regressionsgeraden"

Gütemaß für Korrelation