KI_Unsupervised_Learning_Karteikarten Flashcards

(30 cards)

1
Q

Was ist unüberwachtes Lernen?

A

Eine ML-Technik, die ohne gelabelte Daten arbeitet, um Muster und Strukturen zu erkennen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist Clustering?

A

Eine Methode zur Gruppierung ähnlicher Datenpunkte ohne vorherige Klassenzuordnung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Anwendungen hat Clustering?

A

Astronomie, Bildsegmentierung, Kundenanalyse, Anomalieerkennung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Eigenschaften haben gute Cluster?

A

Hohe Ähnlichkeit innerhalb eines Clusters, geringe Ähnlichkeit zwischen Clustern.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Arten von Clustering gibt es?

A

Partitioniertes Clustering, hierarchisches Clustering, probabilistisches Clustering.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie funktioniert k-Means?

A

Datenpunkte werden iterativ in k Gruppen aufgeteilt, basierend auf der minimalen Distanz zu Cluster-Zentren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welche Schritte umfasst der k-Means Algorithmus?

A
  1. Wähle k zufällige Cluster-Zentren
  2. Weisen jedem Punkt das nächstgelegene Cluster zu
  3. Berechne neue Cluster-Zentren
  4. Wiederhole bis zur Konvergenz.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind Vorteile von k-Means?

A

Einfach, effizient und gut skalierbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind Nachteile von k-Means?

Tipps: Sensitivität und Festlegung

A

Sensitiv gegenüber Ausreißern, erfordert Vorab-Festlegung von k.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie wählt man die optimale Anzahl von Clustern k?

A

Durch Methoden wie Elbow-Methode oder Silhouetten-Analyse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist ein lokales Minimum im k-Means?

A

Eine Lösung, die suboptimal ist, weil die initiale Wahl der Cluster-Zentren nicht ideal war.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie kann man lokale Minima vermeiden?

A

Mehrere zufällige Initialisierungen ausprobieren und beste Lösung wählen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist Graph Clustering?

A

Eine Methode zur Gruppierung von Datenpunkten basierend auf Kantenverbindungen in einem Graphen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche Algorithmen werden für Graph Clustering genutzt?

A

MinCut, Markov Chain Clustering (MCL), Chinese Whispers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist der MinCut-Algorithmus?

A

Eine Methode zur Trennung von Clustern durch Minimierung der Summe der Kanten zwischen Gruppen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie funktioniert Markov Chain Clustering (MCL)?

A

Nutzt zufällige Walks in einem Graphen, um Cluster zu identifizieren.

17
Q

Wie funktioniert der Chinese Whispers Algorithmus?

A

Knoten aktualisieren ihre Cluster-Zugehörigkeit basierend auf Nachbarlabels.

18
Q

Welche Vorteile hat Graph Clustering?

A

Automatische Bestimmung der Cluster-Anzahl, gut für Netzwerke geeignet.

19
Q

Welche Nachteile hat Graph Clustering?

A

Komplexität und hohe Rechenkosten bei großen Graphen.

20
Q

Warum ist die Bewertung von Clustering schwierig?

A

Es gibt keine festen Labels zur Bewertung der Cluster-Qualität.

21
Q

Was ist Purity in Clustering?

A

Ein Maß für die Reinheit eines Clusters, indem der dominierende Klassentyp analysiert wird.

22
Q

Was ist ein Problem mit Purity?

A

Höhere Anzahl an Clustern kann Purity künstlich erhöhen.

23
Q

Welche Alternativen gibt es zur Purity?

A

Silhouetten-Koeffizient, Adjusted Rand Index (ARI), Normalized Mutual Information (NMI).

24
Q

Was ist Reinforcement Learning?

A

Ein ML-Ansatz, bei dem ein Agent durch Interaktion mit der Umgebung belohnt oder bestraft wird.

25
Welche Komponenten hat Reinforcement Learning?
Agent, Umgebung, Aktionen, Zustände, Belohnungen.
26
Was ist der Unterschied zwischen Exploration und Exploitation?
Exploration: Neue Strategien ausprobieren, Exploitation: Bekannte Strategien nutzen.
27
Was ist das ε-greedy Verfahren?
Ein Algorithmus, der mit Wahrscheinlichkeit ε eine zufällige Aktion wählt (Exploration) und mit (1-ε) die beste bekannte Aktion (Exploitation).
28
Was ist die Gridworld-Umgebung?
Ein typisches RL-Problem, in dem ein Agent in einem Raster optimale Wege finden soll.
29
Was ist Q-Learning? Tipp: Belohnung
Ein RL-Algorithmus zur Schätzung der optimalen Belohnungen für jede Aktion.
30
Welche realen Anwendungen hat Reinforcement Learning?
Robotik, Gesundheitswesen, Spiele (z. B. AlphaGo), Finanzmärkte.