KI_Unsupervised_Learning_Karteikarten Flashcards
(30 cards)
Was ist unüberwachtes Lernen?
Eine ML-Technik, die ohne gelabelte Daten arbeitet, um Muster und Strukturen zu erkennen.
Was ist Clustering?
Eine Methode zur Gruppierung ähnlicher Datenpunkte ohne vorherige Klassenzuordnung.
Welche Anwendungen hat Clustering?
Astronomie, Bildsegmentierung, Kundenanalyse, Anomalieerkennung.
Welche Eigenschaften haben gute Cluster?
Hohe Ähnlichkeit innerhalb eines Clusters, geringe Ähnlichkeit zwischen Clustern.
Welche Arten von Clustering gibt es?
Partitioniertes Clustering, hierarchisches Clustering, probabilistisches Clustering.
Wie funktioniert k-Means?
Datenpunkte werden iterativ in k Gruppen aufgeteilt, basierend auf der minimalen Distanz zu Cluster-Zentren.
Welche Schritte umfasst der k-Means Algorithmus?
- Wähle k zufällige Cluster-Zentren
- Weisen jedem Punkt das nächstgelegene Cluster zu
- Berechne neue Cluster-Zentren
- Wiederhole bis zur Konvergenz.
Was sind Vorteile von k-Means?
Einfach, effizient und gut skalierbar.
Was sind Nachteile von k-Means?
Tipps: Sensitivität und Festlegung
Sensitiv gegenüber Ausreißern, erfordert Vorab-Festlegung von k.
Wie wählt man die optimale Anzahl von Clustern k?
Durch Methoden wie Elbow-Methode oder Silhouetten-Analyse.
Was ist ein lokales Minimum im k-Means?
Eine Lösung, die suboptimal ist, weil die initiale Wahl der Cluster-Zentren nicht ideal war.
Wie kann man lokale Minima vermeiden?
Mehrere zufällige Initialisierungen ausprobieren und beste Lösung wählen.
Was ist Graph Clustering?
Eine Methode zur Gruppierung von Datenpunkten basierend auf Kantenverbindungen in einem Graphen.
Welche Algorithmen werden für Graph Clustering genutzt?
MinCut, Markov Chain Clustering (MCL), Chinese Whispers.
Was ist der MinCut-Algorithmus?
Eine Methode zur Trennung von Clustern durch Minimierung der Summe der Kanten zwischen Gruppen.
Wie funktioniert Markov Chain Clustering (MCL)?
Nutzt zufällige Walks in einem Graphen, um Cluster zu identifizieren.
Wie funktioniert der Chinese Whispers Algorithmus?
Knoten aktualisieren ihre Cluster-Zugehörigkeit basierend auf Nachbarlabels.
Welche Vorteile hat Graph Clustering?
Automatische Bestimmung der Cluster-Anzahl, gut für Netzwerke geeignet.
Welche Nachteile hat Graph Clustering?
Komplexität und hohe Rechenkosten bei großen Graphen.
Warum ist die Bewertung von Clustering schwierig?
Es gibt keine festen Labels zur Bewertung der Cluster-Qualität.
Was ist Purity in Clustering?
Ein Maß für die Reinheit eines Clusters, indem der dominierende Klassentyp analysiert wird.
Was ist ein Problem mit Purity?
Höhere Anzahl an Clustern kann Purity künstlich erhöhen.
Welche Alternativen gibt es zur Purity?
Silhouetten-Koeffizient, Adjusted Rand Index (ARI), Normalized Mutual Information (NMI).
Was ist Reinforcement Learning?
Ein ML-Ansatz, bei dem ein Agent durch Interaktion mit der Umgebung belohnt oder bestraft wird.