Estadística Flashcards

(50 cards)

1
Q

¿Qué elemento es esencial en el Storytelling con datos según Carl Anderson?

A

Claridad en la narrativa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

En el análisis de datos, ¿qué describe mejor el proceso de limpieza de datos?

A

Identificación y corrección de errores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué objetivo principal tiene una organización orientada a datos?

A

Tomar decisiones basadas en evidencia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

En regresión lineal simple, ¿qué representa el coeficiente de regresión?

A

La pendiente de la recta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

En regresión múltiple, ¿qué implica usar varias variables independientes?

A

Considerar múltiples factores que afectan la variable dependiente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuál es la finalidad principal de un árbol de decisión?

A

Dividir un problema en decisiones más simples

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué técnica de agrupamiento busca dividir datos en grupos similares?

A

Agrupamiento (Clustering)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué criterio define un ‘buen modelo’ según Foster Provost y Tom Fawcett?

A

Ser simple y predictivo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En la toma de decisiones basada en datos, ¿qué papel juega la intuición?

A

Se utiliza solo después del análisis de datos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Qué representa el error cuadrático medio (MSE) en regresión?

A

El promedio de los errores al cuadrado

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Qué describe mejor un proceso de análisis exploratorio de datos?

A

Describir patrones y relaciones

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿Qué herramienta ayuda a visualizar la relación entre dos variables?

A

Diagrama de dispersión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿Cuál es una ventaja de los árboles de decisión?

A

Fácil interpretación

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Qué problema resuelve el agrupamiento (clustering)?

A

Clasificación automática

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿Qué técnica es supervisada?

A

Árbol de decisión

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Qué modelo es adecuado para predecir una variable continua?

A

Regresión lineal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿Qué es overfitting en un modelo?

A

Demasiado ajuste a los datos de entrenamiento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Qué mide el R-cuadrado en regresión?

A

Proporción de varianza explicada

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

¿Cuál es un supuesto clave en regresión lineal?

A

Independencia de errores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

¿Qué es un valor atípico?

A

Dato que se desvía considerablemente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

¿Qué describe mejor un proceso de análisis exploratorio de datos?

A

Describir patrones y relaciones

Este proceso implica buscar y entender tendencias en los datos.

22
Q

¿Qué herramienta ayuda a visualizar la relación entre dos variables?

A

Diagrama de dispersión

Utilizado para identificar correlaciones entre variables.

23
Q

¿Cuál es una ventaja de los árboles de decisión?

A

Fácil interpretación

Permiten visualizar decisiones y sus posibles consecuencias.

24
Q

¿Qué problema resuelve el agrupamiento (clustering)?

A

Clasificación automática

Agrupa datos similares sin necesidad de etiquetas previas.

25
¿Qué técnica es supervisada?
Árbol de decisión ## Footnote Requiere un conjunto de datos etiquetados para entrenar el modelo.
26
¿Qué modelo es adecuado para predecir una variable continua?
Regresión lineal ## Footnote Utiliza la relación lineal entre variables para hacer predicciones.
27
¿Qué es overfitting en un modelo?
Demasiado ajuste a los datos de entrenamiento ## Footnote El modelo se adapta demasiado a los datos de entrenamiento y falla en generalizar.
28
¿Qué mide el R-cuadrado en regresión?
Proporción de varianza explicada ## Footnote Indica qué tan bien se ajusta el modelo a los datos observados.
29
¿Cuál es un supuesto clave en regresión lineal?
Independencia de errores ## Footnote Los errores de predicción deben ser independientes entre sí.
30
¿Qué es un valor atípico?
Dato que se desvía considerablemente ## Footnote Puede influir significativamente en el resultado de un análisis estadístico.
31
¿Qué describe mejor un proceso de análisis exploratorio de datos?
Describir patrones y relaciones ## Footnote El análisis exploratorio de datos busca identificar tendencias y patrones en los datos antes de aplicar modelos estadísticos.
32
¿Qué herramienta ayuda a visualizar la relación entre dos variables?
Diagrama de dispersión ## Footnote Un diagrama de dispersión es útil para observar la correlación y la relación entre dos variables cuantitativas.
33
¿Cuál es una ventaja de los árboles de decisión?
Fácil interpretación ## Footnote Los árboles de decisión son intuitivos y permiten a los usuarios comprender cómo se toman las decisiones basadas en los datos.
34
¿Qué problema resuelve el agrupamiento (clustering)?
Clasificación automática ## Footnote El agrupamiento organiza los datos en grupos donde los elementos dentro de un grupo son más similares entre sí que a los de otros grupos.
35
¿Qué técnica es supervisada?
Árbol de decisión ## Footnote Los árboles de decisión son modelos supervisados que utilizan datos etiquetados para hacer predicciones.
36
¿Qué modelo es adecuado para predecir una variable continua?
Regresión lineal ## Footnote La regresión lineal es una técnica estadística que modela la relación entre una variable dependiente continua y una o más variables independientes.
37
¿Qué es overfitting en un modelo?
Demasiado ajuste a los datos de entrenamiento ## Footnote El overfitting ocurre cuando un modelo se adapta demasiado a los datos de entrenamiento, capturando ruido en lugar de patrones generalizables.
38
¿Qué mide el R-cuadrado en regresión?
Proporción de varianza explicada ## Footnote El R-cuadrado indica cuánta variabilidad en la variable dependiente se puede explicar a través de la variable independiente en un modelo de regresión.
39
¿Cuál es un supuesto clave en regresión lineal?
Independencia de errores ## Footnote La independencia de errores implica que los errores de predicción no deben estar correlacionados entre sí.
40
¿Qué es un valor atípico?
Dato que se desvía considerablemente ## Footnote Un valor atípico es un dato que se encuentra muy alejado del resto de los datos y puede influir en los resultados de un análisis estadístico.
41
¿Qué describe mejor un proceso de análisis exploratorio de datos?
Describir patrones y relaciones ## Footnote El análisis exploratorio de datos se centra en identificar patrones y relaciones en los datos antes de aplicar modelos estadísticos formales.
42
¿Qué herramienta ayuda a visualizar la relación entre dos variables?
Diagrama de dispersión ## Footnote Los diagramas de dispersión son útiles para observar la correlación entre dos variables y detectar tendencias.
43
¿Cuál es una ventaja de los árboles de decisión?
Fácil interpretación ## Footnote Los árboles de decisión son intuitivos y permiten una fácil comprensión de las decisiones que se toman en el modelo.
44
¿Qué problema resuelve el agrupamiento (clustering)?
Clasificación automática ## Footnote El agrupamiento permite organizar datos en grupos basados en similitudes sin necesidad de etiquetas predefinidas.
45
¿Qué técnica es supervisada?
Árbol de decisión ## Footnote Los árboles de decisión son un método de aprendizaje supervisado donde se entrena el modelo con datos etiquetados.
46
¿Qué modelo es adecuado para predecir una variable continua?
Regresión lineal ## Footnote La regresión lineal se utiliza para modelar la relación entre una variable dependiente continua y una o más variables independientes.
47
¿Qué es overfitting en un modelo?
Demasiado ajuste a los datos de entrenamiento ## Footnote El overfitting ocurre cuando un modelo se ajusta demasiado a los datos de entrenamiento, perdiendo capacidad de generalización.
48
¿Qué mide el R-cuadrado en regresión?
Proporción de varianza explicada ## Footnote El R-cuadrado indica qué tan bien los datos se ajustan al modelo de regresión, representando la varianza explicada por el modelo.
49
¿Cuál es un supuesto clave en regresión lineal?
Independencia de errores ## Footnote La independencia de errores es un supuesto fundamental que establece que los errores de predicción no deben estar correlacionados.
50
¿Qué es un valor atípico?
Dato que se desvía considerablemente ## Footnote Los valores atípicos son observaciones que se encuentran significativamente alejadas de otras en el conjunto de datos, pudiendo influir en los resultados del análisis.