Tema4 Flashcards
(48 cards)
¿Qué es la regresión logística y para qué se usa?
Es un algoritmo de clasificación que modela la probabilidad de pertenencia a una clase utilizando una función logística.
¿Cómo se determina la clasificación en regresión logística binaria?
Se compara la probabilidad obtenida con un umbral, comúnmente 0.5, para asignar la clase.
¿Qué es la curva ROC en clasificación?
Es una gráfica que muestra la relación entre la tasa de verdaderos positivos y la tasa de falsos positivos a diferentes umbrales de clasificación.
¿Qué indica un valor de AUC cercano a 1 en la curva ROC?
Que el clasificador tiene un excelente desempeño, diferenciando bien entre clases.
¿Cómo se adapta la regresión logística a problemas de clasificación multiclase?
Se usa el esquema One-vs-Rest (OvR), entrenando un clasificador binario para cada clase.
¿Cuál es el principio de los árboles de decisión?
Dividir los datos jerárquicamente en función de los valores de los atributos hasta alcanzar una clasificación clara.
¿Cómo se determina el mejor atributo en cada nodo de un árbol de decisión?
Utilizando métricas como la ganancia de información o el índice de Gini.
¿Qué significa que un árbol de decisión está sobreajustado?
Que es demasiado específico con los datos de entrenamiento y no generaliza bien en nuevos datos.
¿La regresión logística se usa solo para regresión? (Sí/No)
No, es un algoritmo de clasificación.
¿El modelo de regresión logística puede usarse para clasificación multiclase? (Sí/No)
Sí, mediante el enfoque One-vs-Rest.
¿Un clasificador con AUC = 0.5 tiene buen desempeño? (Sí/No)
No, es equivalente a una clasificación aleatoria.
¿Los árboles de decisión pueden manejar datos categóricos? (Sí/No)
Sí, pueden dividir datos en función de valores categóricos.
¿Los árboles de decisión requieren normalización de datos? (Sí/No)
No, no son sensibles a la escala de los atributos.
¿El algoritmo CART solo produce árboles binarios? (Sí/No)
Sí, a diferencia de otros métodos como ID3.
¿La poda de un árbol de decisión reduce el sobreajuste? (Sí/No)
Sí, eliminando ramas irrelevantes o poco representativas.
¿El modelo de regresión logística siempre genera una frontera de decisión lineal? (Sí/No)
Sí, en su forma básica, aunque puede mejorarse con transformaciones no lineales.
La función logística convierte valores en un rango entre ____ y ____.
0 y 1.
La clasificación en regresión logística se basa en un ____ de probabilidad.
umbral.
En clasificación multiclase, la estrategia One-vs-Rest entrena un modelo para cada ____.
clase.
La métrica AUC se calcula sobre la curva ____.
ROC.
Los árboles de decisión dividen los datos en función de los ____.
atributos.
Un árbol de decisión muy profundo puede sufrir ____.
sobreajuste.
La métrica de Gini mide la ____.
pureza de los nodos.
La poda de un árbol de decisión consiste en eliminar ____.
ramas irrelevantes.