Modul 4 - Datenanalyse Flashcards

(19 cards)

1
Q

Deskriptives Verfahren (Datenanalyse)

A

Orientierung an Stichprobe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Induktives Verfahren (Datenanalyse)

A

Von der Stichprobe auf die Grundgesamtheit schließen können

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Lageparameter: Arithmetisches Mittel

A

Mittelwert

X = 1/n * (x1 + x2 + … + xn)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Lageparameter: Median

A

Wert der den Datensatz in zwei gleich Große hälften teilt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Streuungsparameter: Varianz

A

Quadrierte Abweichung vom Mittelwert

S^2 = 1/(n-1) * Summe 1 bis n von (xi - Mittelwert)^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Streuungsparameter: Standardabweichung

A

Abweichung vom Mittelwert

Wurzel der Varianz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Definition Korrelationsanalyse

A

Verfahren zur Bestimmung der Stärke linearer Zusammenhänge zwischen zwei metrisch skalierten Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Logik der Korrelationsanalyse

A
  • Korrelationskoeffizient kann Werte von -1 bis 1 annehmen
  • Keine Korrelation = Unabhängigkeit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Definition Regressionsanalyse

A

Analyse einer einseitigen Abhängigkeit zwischen einer unabhängigen Variablen (x) und einer abhängigen
Variablen (y)
.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vorgehensweise Regressionsanalyse

A
  • lineare Schätzfunktion y = a+b*x aufstellen
  • Ziel: a und b möglichst gut an empirische Daten anpassen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Definition Multiple Regressionsanalyse

A

Analysiert den einseitigen Einfluss mehrerer unabhängiger Variablen xj (j = 1, …J) auf eine abhängige
Variable
(y).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vorgehensweise multiple Regressionsanalyse

A
  • Ermittlung einer Schätzfunktion y = a + b1x1 + b2x2 + … + bj*xj + e
  • Schätzung der Regressionskoeffizienten a, b1, …
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wichtig bei multiplen Regressionsanalyse

A

Standardisierung der Regressionskoeffizienten (wegen verschiedenen Skalen)

B = b * (Standardabweichung x / Standardabweichung y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ablauf der Faktoranalyse

A
  1. Erstellen der Datenmatrix
  2. Berechnung der Korrelationsmatrix
  3. Bestimmung der Faktoren
  4. Rotation und Interpretation der Faktoren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Definition Faktorenanalyse

A

Reduziert eine größere Zahl an beobachteten Variablen (= Indikatorvariablen) auf wenige dahinterliegende nicht direkt
messbare (= latente) Faktoren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Definition Clusteranalyse

A

Die Clusteranalyse fasst Objekte (z.B. Kunden) auf Basis von ausgewählten Variablen zu Gruppen/Clustern
(z.B. Kundensegmente) zusammen
.

17
Q

Vorgehensweise Clusteranalyse

A
  1. Auswahl der Clustervariablen und Aufstellen der Datenmatrix
  2. Aufstellen einer Distanzmatrix
  3. Clusteralgorithmus
  4. Bestimmung der Clusterzahl
  5. Interpretation und Benennung der Cluster anhand der Merkmalsmittelwerte
18
Q

Aufstellung einer Distanzmatrix

A

Summe der quadrierten Differenz aller Werte

19
Q

Wie lässt sich die optimale Clusterzahl erkennen?

A

Anhand des Elbows (wenn Distanzmarke zu groß wird)