Tema1 Flashcards
(50 cards)
¿Qué tipo de modelos genera el aprendizaje automático?
A) Teóricos
B) Abstractos basados en datos históricos
C) Matemáticos ideales
D) Experimentales puramente cualitativos
B) Abstractos basados en datos históricos
¿Cuál es la primera fase de la metodología CRISP-DM?
A) Comprensión de los datos
B) Preparación de los datos
C) Comprensión del negocio
D) Modelado
C) Comprensión del negocio
¿Qué tipo de problemas aborda el aprendizaje supervisado?
A) Aquellos con una variable de salida definida
B) Problemas sin una variable de interés
C) Reducción de dimensionalidad
D) Optimización de procesos industriales
A) Aquellos con una variable de salida definida
¿Qué técnica se utiliza en aprendizaje no supervisado para crear grupos de datos similares?
A) Reglas de asociación
B) Reducción de dimensionalidad
C) Clustering
D) Regresión
C) Clustering
¿Qué implica la normalización de datos?
A) Transformar valores al rango continuo [0, 1]
B) Ajustar la media y la desviación típica
C) Eliminar valores ausentes
D) Crear nuevos atributos a partir de datos existentes
A) Transformar valores al rango continuo [0, 1]
¿Cuál es una técnica común para reemplazar valores ausentes?
A) Eliminación de la fila
B) Sustitución por la media, mediana o moda
C) Aplicación de normalización
D) Uso del algoritmo de clustering
B) Sustitución por la media, mediana o moda
¿Qué se analiza en la fase de comprensión de los datos?
A) Estructura y distribución de los datos
B) Interpretación de los modelos generados
C) Desarrollo del plan de proyecto
D) Aplicación de algoritmos de aprendizaje automático
A) Estructura y distribución de los datos
¿Qué técnica de selección de atributos elimina aquellos con valores casi constantes?
A) Eliminación por baja varianza
B) Clustering
C) Regresión
D) Estandarización
A) Eliminación por baja varianza
¿Qué tarea de limpieza verifica la consistencia y la cantidad de valores fuera de rango?
A) Recolección de datos iniciales
B) Verificación de la calidad de los datos
C) Selección de atributos
D) Normalización
B) Verificación de la calidad de los datos
¿Qué algoritmo asume una distribución normal para detectar outliers?
A) Árboles de decisión
B) Envolvente elíptica
C) Redes neuronales
D) Reglas de asociación
B) Envolvente elíptica
¿El aprendizaje automático genera modelos teóricos?
No, genera modelos empíricos basados en datos.
¿La metodología CRISP-DM incluye la fase de evaluación de negocio?
Sí.
¿En qué rango se transforman los valores durante la normalización?
En el rango [0, 1].
¿Es necesario que todos los datos tengan una variable de salida en aprendizaje supervisado?
Sí, para que se pueda aprender de ellos.
¿Los modelos en aprendizaje supervisado pueden ser de clasificación o regresión?
Sí.
¿El clustering es una técnica utilizada en aprendizaje supervisado?
No, es utilizada en aprendizaje no supervisado.
¿La eliminación por baja varianza es una técnica supervisada de selección de atributos?
No, es una técnica no supervisada.
¿Se puede utilizar la media para imputar valores ausentes en atributos numéricos?
Sí.
¿El algoritmo de envolvente elíptica supone que los datos siguen una distribución normal?
Sí.
¿El proceso KDD incluye la fase de comprensión del negocio como CRISP-DM?
No.
¿Qué tipo de modelos genera el aprendizaje automático?
A) Empíricos basados en datos históricos
B) Teóricos experimentales
C) Conceptuales sin datos
D) Cualitativos analíticos
A) Empíricos basados en datos históricos
¿Cuál es la fase inicial de la metodología CRISP-DM?
A) Comprensión de los datos
B) Evaluación del negocio
C) Comprensión del negocio
D) Modelado
C) Comprensión del negocio
¿Qué técnica se utiliza para agrupar datos similares en aprendizaje no supervisado?
A) Clasificación
B) Regresión
C) Clustering
D) Reducción de dimensionalidad
C) Clustering
¿Qué ocurre en la fase de normalización de datos?
A) Se eliminan valores atípicos
B) Se transforman los valores al rango [0, 1]
C) Se sustituyen los valores ausentes por la media
D) Se seleccionan atributos relevantes
B) Se transforman los valores al rango [0, 1]