Klyngeanalyse Flashcards

1
Q

Forklar hvad der sker i Agglomeration Schedule?

A

I Agglomeration Schedule sammenlægger man klyngerne efter hierarkisk metode.

Hver respondent/observationen er i en klynge for sig!
Det giver ikke mening at have fx 29 observationer der er i hver sin klynge, da vi vil jo segmentere, og det giver heller ikke mening at lægge dem alle sammen i samme klynge. Vi skal have fundet en god klyngeløsning.

Figuren viser:

Stage: Viser hvilket stage man er i.

Cluster combined: Viser hvilke observationer som ligner hinanden og som bliver lagt sammen.

Coeffients: Viser afstanden mellem klyngerne. I starten af afstanden lille, fordi klyngerne/respodenterne ligner meget hinanden, men efterhånden som de bliver lagt sammen, så bliver afstanden og klyngerne større og større, indetil alle er samlet under i 1 klyngeløsning.

Next stage: Viser hvornår en klynge bliver lagt sammen med en anden klynge.

Nede i bunden har man den sidste sammenlægning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hvad er Wards methods? (eller hierakisk metode)

A

Det er en metode, hvor man anvender afstanden mellem observationerne til at danne klyngerne. Ward’s procedure danner klynger ud fra kriteriet om at opnå mindst
mulig varians inden for klyngerne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hvad er Squared Euclidian Distance?

A

Det er en metode til at måle afstanden mellem observationerne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvad handler hierarkisk metode om og hvordan ses det i Agglomeration Schedule

A

Det er en metode til at danne klynger. Dvs. segmentere respodentere som fx har ens holdninger i klynger.

Metoden kaldes hierakisk metode, også kaldt Ward Methods. Det er handler om at vi starter med hvert enkelt observation/respondent i en separat klynge. Klynger er dannet ved at gruppere observationer/respondendet i større og større klynger. Denne proces fortsætter, indtil alle observationer/respondenter er medlemmer af en enkelt klynges

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvorfor laver man en anova test?

A

Der laves en anova test for at validere klyngeløsningen, dvs. anova går ind og tester på om middelværdierne er signikant forskellige fra hinanden eller ej.

De skulle helst gerne være det, for ellers vil en klyngeanalyse ikke give mening.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvad går elbow/albue-metoden ud på?

A

Albue metoden bruges til at fastlægge antallet af klynger vi skal bruge. Vælger man fx 6 klynger, så skal man i hver klynge kigge efter, hvor den største afstand er.

Når man har målt 6 afstande, sætter man det ind ind i en graf, hvor Y aksen måler afstanden og antal klynger på x-aksen.

man sætter sammen, jo større bliver afstanden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Forklar forskellen på klynge og faktor?

A

Faktoranalyse forsøger at gruppere variable, dvs. respodenternes svar.

Klyngeanalyse forsøger - på basis af udvalgte - variable, at gruppere respodenterne. Dvs. segmentere.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hvad er en klyngeanalyse?

A

En klyngeanalyse er en strukturanalyse, hvor formålet er at

segmentere er at opdele personer i grupper med samme behov, livsmønstre og interesser.
Ideen med segmentering er, at du kan koncentrere dine aktiviteter mod udvalgte grupper frem for hele markedet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Der er to ting man skal beslutte i en klynge analyse:

1) Hvordan måles afstanden mellem observationerne givet de forskellige variable man har valgt?

2) Hvordan bruges afstanden til at gruppere klyngerne? (danne klyngerne)?

A

Svar:

1) Afstanden måles ved brug af Squared Euclidian distance.

2) Vi bruger hierakisk metode, også kaldt Ward Methods. Det er handler om at vi starter med hvert enkelt observation/respondent i en separat klynge. Klynger er dannet ved at gruppere observationer/respondendet i større og større klynger. Denne proces fortsætter, indtil alle observationer/respondenter er medlemmer af en enkelt klynge.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hvilke krav til skalatype er der for klyngeanalyse? (dvs. de variable man arbejder med)

A

Numerisk skala (interval) da man kan beregne gennemsnit.
Det er ikke muligt at gøre hvis man fx havde nominal skala.

Det er vigtigt at variablerne har samme skala!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvordan har I brugt klyngeanalyse i jeres opgave?

A

Vi arbejder med Q15 og Q16 som er holdningsspørgsmål, ift. hvad man lægger vægt på, når man skal købe hhv. nyt eller brugt. Vi vil med klyngeanalyse forsøge at segmentere respondenterne efter hvad de lægger vægt på.

I faktoranalysen havde vi dannet variablerne:
- Prestige
- Teknologi
- Kvalitet
- Miljø.

Det er disse variable som vi vil gøre brug af. Disse variable er nummeriske (intervalskala fra 1-5) og kan derfor bruges i en klyngeanalyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hvilke variable må man ikke bruge? og hvorfor?

A

Der må aldrig bruges baggrundsvariable (alder, køn, indkomst, bopæl m.v) ! Det er fordi man skal bruge dem senere hen til at profilere klyngerne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hvorfor bruger vi ikke dendogram? og hvad er det?

A

Det er en metode til at fastlægge antal klynger.
Vi bruger den ikke fordi vi har rigtig mange observationer. Det giver mening når man fx har 8-10 observationer, men vi har op mod 800 stk, så det vil se meget uoverskueligt ud.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvad gør man efter man har lavet en klynge analyse? Altså efter man har valgt antal klyngeløsning, kigget på deres middelværdier og navngivet dem?

A

Der laves en validering af klyngeanalysen, via en anovatest. Dette er for at undersøge om der er en signifikant forskel mellem middelværdierne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Forklar hvordan I har brugt klyngeanalyse i jeres projekt?

A

Vi ønskede at undersøge om man kunne segmentere respodenterne ud fra hvad de lagde vægt på (brugt Q15 og Q16 til dette og hvad der kendetegnede dem.

Vi brugte hierarkisk metode til at danne klyngerne (dvs. man starter ud hvor repodenten er en klynge for sig selv, derefter blive den lagt sammen med anden osv… og bliver større og større). Afstanden mellem klyngerne blev målt via. Squared equlidian distance. .

Derefter sammenlignede vi middelværdierne på klyngernes variabler. Herfra kunne vi se hvordan klyngernes svarede i gns. til de forskellige variable. . Derefter kunne man navngive dem.

Herefter skulle klyngerne valideres - altså er der en signifikant forskel på middelværdierne. Det skal der helst være. .. (Der brugte vi anova).

Til sidst prøvede vi at udføre test ift. klyngetilhør og baggrundsvariable indkomst (er der sammenhæng mellem alder og klyngetilhør)

Man kunne også lave det på køn. .

How well did you know this?
1
Not at all
2
3
4
5
Perfectly