Estadística Flashcards
(50 cards)
¿Qué elemento es esencial en el Storytelling con datos según Carl Anderson?
Claridad en la narrativa
En el análisis de datos, ¿qué describe mejor el proceso de limpieza de datos?
Identificación y corrección de errores
¿Qué objetivo principal tiene una organización orientada a datos?
Tomar decisiones basadas en evidencia
En regresión lineal simple, ¿qué representa el coeficiente de regresión?
La pendiente de la recta
En regresión múltiple, ¿qué implica usar varias variables independientes?
Considerar múltiples factores que afectan la variable dependiente
¿Cuál es la finalidad principal de un árbol de decisión?
Dividir un problema en decisiones más simples
¿Qué técnica de agrupamiento busca dividir datos en grupos similares?
Agrupamiento (Clustering)
¿Qué criterio define un ‘buen modelo’ según Foster Provost y Tom Fawcett?
Ser simple y predictivo
En la toma de decisiones basada en datos, ¿qué papel juega la intuición?
Se utiliza solo después del análisis de datos
¿Qué representa el error cuadrático medio (MSE) en regresión?
El promedio de los errores al cuadrado
¿Qué describe mejor un proceso de análisis exploratorio de datos?
Describir patrones y relaciones
¿Qué herramienta ayuda a visualizar la relación entre dos variables?
Diagrama de dispersión
¿Cuál es una ventaja de los árboles de decisión?
Fácil interpretación
¿Qué problema resuelve el agrupamiento (clustering)?
Clasificación automática
¿Qué técnica es supervisada?
Árbol de decisión
¿Qué modelo es adecuado para predecir una variable continua?
Regresión lineal
¿Qué es overfitting en un modelo?
Demasiado ajuste a los datos de entrenamiento
¿Qué mide el R-cuadrado en regresión?
Proporción de varianza explicada
¿Cuál es un supuesto clave en regresión lineal?
Independencia de errores
¿Qué es un valor atípico?
Dato que se desvía considerablemente
¿Qué describe mejor un proceso de análisis exploratorio de datos?
Describir patrones y relaciones
Este proceso implica buscar y entender tendencias en los datos.
¿Qué herramienta ayuda a visualizar la relación entre dos variables?
Diagrama de dispersión
Utilizado para identificar correlaciones entre variables.
¿Cuál es una ventaja de los árboles de decisión?
Fácil interpretación
Permiten visualizar decisiones y sus posibles consecuencias.
¿Qué problema resuelve el agrupamiento (clustering)?
Clasificación automática
Agrupa datos similares sin necesidad de etiquetas previas.