Clusteranalyse Flashcards

(13 cards)

1
Q

Ziele von Clusteranalysen

A
  1. Marktsegmentierung
  2. Spezifische Gruppen identifizieren und deren Kaufverhalten verstehen
  3. Marken und Produkte Clustern
  4. Testmärkte Clustern
  5. Gesellschaftliche Strukturen verstehen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vorgehen Clusteranalyse

A
  1. Variablen auswählen
  2. Distanzmass auswählen
  3. Cluster-Verfahren auswählen
  4. Anzahl Cluster bestimmen
  5. Validität der Cluster-Lösung beurteilen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Variablen auswählen

Formale Anforderungen

A
  • alle Variablen sollten möglichst gleich viel Gewicht haben (z-standartisierung)
  • Ausreisser ausschliessen
  • möglichst distinktive Variablen
  • beobachtbare- und nicht beobachtbare Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Distanzmass
A
  • Euklidische Distanz

- City-Block Distanz ->höheres Distanzmass

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  1. Clusterverfahren auswählen
A
  • hierarchisch: Schrittweise Gruppenbildung ->Zuteilung zu Gruppen ist endgültig
  • nonhierachrisch: Anzahl Cluster uns Startgruppierung wird vorgegeben ->schrittweises verschieben , bis Gruppierung nicht mehr besser wird (bsp- K-Means)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

beschreibe die hierarchischen Clusterverfahren

A
  • Für metrisch, nominalskalierte oder gemischt skalierte Variablen
  • Für grosse Fallzahlen nicht geeignet
  • Clusteranzahl muss nicht vorgegeben werden
  • 1 Durchgang berechnet mehrere Lösungen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie ist der Ablauf der hierarchischen Clusteranalyse

A

jedes Objekt in 1 Cluster> Berechnung aller Distanzen > Suche nach den 2 Objekten mit geringster Distanz > Zusammenfassung der ähnlichsten Objekte
>Berechnung der neuen Abstände bis alle Objekte wieder in 1 Gruppe sind
=sehr langer Prozess

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Welche Arten der Distanz gibt es?

A
  • single Linkage (nächstgelegener Nachbar)
  • Complete Linkage (entferntester Nachbar)
  • Average Linkage
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ablauf K-Means

A

Vorgabe Startgruppierung> Berechnung Mittelwerte für Gruppeneigenschaften> Berechnung Fehlerquadratsummen> Was passiert bei Objektverschiebeung> Verminderung Fehlerquadratsumme? >J= Verlagerung des Objekts> Neuberechnung der Gruppenmittelwerte bis alle Objekte untersucht sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  1. Anzahl Cluster bestimmen
A
  • > keine festen Regeln
  • Theoretische oder pragmatische Gründe
  • Sprung bei Koeffizienten (Struktogramm oder Dendogramm)
  • Relative Grösse von Clustern
  • Clusteranzahl im Verhältnis zu Varaiblenanzahl, Wertevariation und Fallzahl
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  1. Reliabilität und Validität der Cluster-Lösung beurteilen
A
  • verschiedene Distanzmasse ausprobieren
  • Verschiedene Clustermethoden ausprobieren
  • Split half
  • Bei nicht hierarchischen Verfahre kann die Reihenfolge eine Rolle spielen ->verschiedene Reihenfolgen ausprobieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Clusteranalyse wird massgeblich beeinflusst durch…

A
  • Wahl der Variablen
  • Wahl des Fusionierungsalgorithmus
  • Merkmale der zu clusternden Variablen
  • Merkmale der zu gruppierenden Elementen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kritik der Clusteranalyse

A
  • vergleichsweise unwissenschaftlich
  • kein singstiftendes Verfahren, sondern ein klassifizierendes Verfahren
  • Unterschiedliche Verfahren führen meist zu anderen Ergebnissen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly