Clase 8 - Ensambles y boosting Flashcards

Question 1

Q

Bagging y Boosting trabajan de forma distinta. ¿Cómo es cada uno?

Answer

A

Bagging trabaja de forma paralela (hace varias cosas “al lado de otra” y junta los resultados), mientras que boosting trabaja de forma secuencial (cada paso entrena sobre lo del paso anterior).

Question 2

Q

¿Cuál es la idea básica de Boosting?

(Los pasos genéricos con los que trabaja)

Answer

A

Entrena un árbol de decisión
Se fija en qué observaciones predijo mal
Construye un segundo árbol de decisión, enfocándose en las observaciones que predijo mal antes
Como predicción final, toma una cierta combinación entre las predicciones anteriores

Question 3

Q

Dentro de un algoritmo de boosting. ¿Cómo son los árboles individuales?

Answer

A

Suelen ser pequeños y con pocos cortes

Question 4

Q

¿Por qué es difícil de paralelizar un algoritmo de boosting?

Answer

A

Porque cada árbol nuevo adicional depende de lo que predijeron los anteriores. Entonces, para empezar el árbol nuevo, el anterior debe estar terminado.

Question 5

Q

¿Cómo maneja XGBoost los valores faltantes?

Answer

A

Para cada variable, se fija cuál es la ganancia máxima si pasa los missings a la derecha, y cuál es la ganancia máxima si pasa los missings a la izquierda. Se elije el caso que mayor ganancia genere.

(Sparcity aware split-finding)

Question 6

Q

¿Cuáles son los hiperparámetros más importantes de XGBoost?

Answer

A

nrounds: número de árboles
max_depth: profundidad máxima de los árboles
eta: learning rate
gamma: mínima reducción del error para generar un corte
lambda: parámetro de regularización
colsample_bytree: variables a muestrear y considerar en cada árbol
min_child_weight: mínima cantidad de observaciones en los hijos para considerar un corte
subsample: muestreo de observaciones a considerar en cada árbol

Clase 8 - Ensambles y boosting Flashcards

(6 cards)