Kmeans Flashcards

(6 cards)

1
Q

A cosa mira il clustering?

Che misura di similarità?

A

A dividere gli elementi in k gruppi che presentano caratteristiche simili.

La similarità può essere calcolata per esempio con la distanza euclidea.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Come misurare la similarità?

A

Somma delle distanze tra ogni punto e il suo centroide assegnato.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qual’é la complessità degli algoritmi in grado di trovare la soluzione ottimale del problema del clustering?
Il problema di che tipo è?

Quindi cosa si prova a cercare e con che complessità?

A

> polinomiale, intrattabile.

Algoritmi euristici cercano una soluzione approssimata con complessità al massimo polinomiale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Passaggi del Kmeans

A

-fisso il numero di k cluster
- scelgo i k centroidi
- assegno gli elementi
- se la somma delle similarità differisce di almeno un certo valore soglia dalla precedente iterazione allora si ricalcolano le posizione dei centroidi e si ripete.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Complessità algoritmo k means ?

A

O(t * n* k* d):
- t numero di iterazioni effettuate
- n numero di elementi del dataset
- k numero di cluster da formare
- d dimensioni dei punti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Metodo del gomito

A

Al variare del numero di k eseguo l’algoritmo e vedo come varia l’errore.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly