V04 - Entscheidungsbaumverfahren Flashcards

1
Q

Wie ist die grundsätzliche Arbeitsweise bei Entscheidungsbäumen? (V04F12)

A

○ 1 Aufteilung des Gesamtbestandes in eine Trainings- und eine Testmenge
○ 2 Sukzessive Aufteilung der Trainingsmenge, so dass sich daraus homogenere Gruppen von Datensätzen bezüglich der Klassifikationsvariablen ergeben
○ 3 Darstellung der Aufteilung der Datenmenge durch einen Baum, in dem jeder Knoten eine Datenmenge indiziert, dem ein Homogenitätsmaß zugeordnet wird
○ 4 Fortführung der Aufteilung, bis das Homogenitätsmaß einen vorgegebenen Wert erreicht
○ 5 Überprüfung der Ergebnisse anhand der Testmenge

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Entropie? (V04F18)

A

○ Ein Maß für die Heterogenität
○ Ist Entropie = 0, so ist der Knoten homogen
○ Sie nimmt ihren Maximalwert an (log2 der Klassenanzahl), wenn eine Gleichverteilung vorliegt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist der Gini-Index? (V04F20)

A

○ Ist ein Maß für die Homogenität eines Knoten T
○ Ist Gini(T) = 0, so ist der Knoten homogen
○ Der Gini-Index nimmt seinen Maximalwert an, wenn eine Gleichverteilung vorliegt
○ Es wird dann der Split gewählt, der den kleinsten Gini-Index für eine Partition des Knotens T mittels Attribut A bringt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind Vorteile von Entscheidungsbäumen im Vergleich zu z.B. Neuronalen Netzen? (V04F??)

A

○ Entscheidungsbäumen folgen klaren, nachvollziehbaren Regeln und sind lesbar, dies ist bei Neuronalen Netzen nicht der Fall
○ Entscheidungsbäume = White-Box Verfahren
○ Neuronale Netze = Black-Box Verfahren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly