6 Decision trees Flashcards
(10 cards)
Decison tree
Een decision tree is een model dat beslissingen maakt op basis van regels in de vorm van een boomstructuur. Het splitst data stap voor stap op basis van kenmerken (features) om tot een voorspelling te komen.
Classification tree
Wordt gebruikt als de uitkomst (label) categorisch is (bijv. “ja” of “nee”, “spam” of “niet spam”).
Elk blad (eindknoop) van de boom voorspelt een klasse.
Regression tree
Wordt gebruikt als de uitkomst numeriek is (bijv. prijs, temperatuur).
Elk blad voorspelt een getal (bijv. gemiddelde waarde in die groep).
Accuracy, feature importance
Node,
Een node is een punt in de boom waar een beslissing wordt genomen, bijvoorbeeld:
“Is leeftijd > 30?”
Grid search
Methode om de beste instellingen (hyperparameters) te vinden.
Probeert systematisch combinaties, zoals:
Max tree depth = 3, 5, 7
Min samples per split = 2, 5, 10
Vaak in combinatie met cross-validation.
Ensemble
Een ensemble is een methode waarbij meerdere modellen gecombineerd worden om samen een betere voorspelling te doen dan één enkel model.
Random forest
Een ensemble van veel decision trees.
Gradient boosting
Een geavanceerde ensemble-techniek die opeenvolgend bomen traint.
Elke nieuwe boom probeert de fouten van de vorige te corrigeren.
tree depth
De diepte van een boom is het aantal beslissingslagen van root tot aan een blad.