Untitled Deck Flashcards
(91 cards)
¿Cuál es el objetivo del ACP?
Reducir la dimensión del conjunto de datos conservando la mayor parte de la información.
¿En qué tipo de variables se utiliza el ACP?
En variables numéricas.
¿Qué se hace con las variables categóricas en lugar de ACP?
Se utiliza el análisis de correspondencias.
¿Qué mide la matriz de covarianza?
La variación conjunta de dos o más variables aleatorias.
En teoría de probabilidad, la varianza de una variable aleatoria es una
medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media
¿Qué mide el coeficiente de correlación de Pearson?
La fuerza y dirección de la relación lineal entre dos variables. siempre y cuando ambas sean cuantitativas y continuas.
Diferencia entre covarianza y correlación
La covarianza no está estandarizada, mientras que la correlación varía entre -1 y 1 y es independiente de la escala.
¿Qué porcentaje de la variabilidad total explican las calorías en el conjunto de datos de cereales?
66%
¿Qué representa el primer componente principal (z1)?
La dirección de mayor variabilidad en los datos.
¿Qué condición cumplen los componentes principales entre sí?
Son ortogonales (correlación = 0).
¿Qué hace la función pca.explained_variance_ratio_
?
Indica qué porcentaje de la varianza total explica cada componente.
¿Por qué se deben normalizar los datos antes del ACP?
Porque algunas variables pueden tener escalas distintas que dominan la varianza total.
¿Cómo se normaliza una variable?
Dividiendo cada valor entre su desviación estándar.
¿Cuántos componentes se requieren para explicar más del 90% de la variabilidad en los cereales?
Siete componentes.
¿Qué medidas resumen la tendencia central?
Media, mediana y moda.
¿Qué medidas resumen la dispersión?
Rango, varianza y desviación estándar.
¿Qué es la varianza?
El promedio de las desviaciones al cuadrado respecto a la media.
¿Qué tipo de gráfica muestra la distribución de una variable?
Histograma.
¿Qué indica un sesgo positivo en una distribución?
Valores extremos hacia la derecha.
¿Qué representa el coeficiente β1 en una regresión lineal simple?
El cambio esperado en Y por cada unidad de cambio en X.
¿Qué mide el R² en una regresión?
El porcentaje de la variabilidad en Y explicada por X.
¿Qué mide la covarianza?
Cómo varían juntas dos variables.
¿Qué mide el coeficiente de correlación?
La dirección y fuerza de la relación lineal entre dos variables.
¿Qué se necesita cumplir para que la regresión sea válida?
Linealidad, independencia, homocedasticidad y normalidad de los residuos.