Todo Flashcards
(32 cards)
Variabilidad
La variabilidad en estadística mide qué tanto se dispersan los datos respecto a una medida central y entre sí.
Variable
Una variable es un característica o propiedad que cambia con la información de cada individuo, se puede medir o agrupar, pueden ser cuantitativas o cualitativas.
Cualitativo/Cuantitativo
-Cualitativo: Son datos que representan categorías o características sin valores numéricos. (color de ojos)
-Cuantitativo: Son datos expresados con números y permiten operaciones matemáticas. (Número de hermanos)
Grafica. Que debe contener
Título, Ejes definidos, etiqueta de ejes, escala adecuada, descripción, fecha.
1° Definiciones :
1. Dicotomía
2. Variable nominal
3.Base de datos
4. Dato perdido
- Las opciones son mutuamente excluyentes (te gusta el futbol: si/no)
- Sirve para identificar al individuo o sujeto
3.Colección de casos, variables y categoría sobre datos determinados. Conjunto organizado de datos - No se obtuvo la información adecuada
2° Definiciones
1.Dato crudo
2. Dato procesado
3. Caso
4. Punto medio de clase
1°Dato sin información procesada ni interpretación asociada, que no aporta información adicional.
2° Dato procesado: Son aquellos datos cuya interpretación ya ha sido descifrada y aporta información.
3. Es casa unidad de observación/individuo con su información
4. Es un numero encontrarle a la mitad de una clase que representa una categoría, este punto medio puede ayudar a estimar los datos originales.
Se calcula= (Max-min)/5
3° Definiciones
1. Imputar
2. Variable ordinal
1- Se remplaza el dqato perdido. en caso de tener pocos, o suprimir la categoria si son muchos.
2-Una variable ordinal es un tipo de variable cualitativa cuyos valores representan categorías con un orden lógico o jerarquía, pero sin una distancia numérica exacta entre ellas. (Nivel de satisfacción (bajo, medio, alto), nivel educativo (primaria, secundaria, universidad))
1.Categorias
2. clases
3. Intervalo de clases
4. Marca de clase
- grupo o conjunto de valores que comparten características comunes. Son contables los datos similares. Se usa para cualitativos
- Cuando hay una gran cantidad de categorias individuales, estas se pueden agrupar en clases.
- Para determinar cuanto habra en la clase (intervalo de clase), se usa la formula= Max-min/ no de grupos deseados (de preferencia 5 o 10)
- La marca de clase es el punto medio de cada intervalo en una tabla de frecuencias con datos agrupados.
Se calcula como:
Marcadeclase= límite inferior+ límite superior/2
Tipos de graficas y cuando usarlas
1- Gráfica de barras: Para comparar categorías, Cualitativa o Cuantitativa. ejemplo: Número de estudiantes por carrera
2- Gráfica circular (pastel): Para mostrar proporciones o porcentajes, Cualitativa Porcentaje de personas por tipo de sangre
3-Histograma, barras, pero en grupos agrupados en intervalos, Cuantitativa continua, Distribución de edades (en intervalos)
4-Polígono de frecuencias, Para comparar distribuciones, Cuantitativa, Comparar frecuencia de edades
x (variable), Frecuencia, frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada.
-Frecuencia: Es el número de veces que aparece un valor en el conjunto de datos
-frecuencia acumulada: Es la suma de las frecuencias absolutas desde el primer valor hasta el valor actual
-frecuencia relativa: Es la proporción de cada categoría respecto al total de datos. Se obtiene dividiendo la frecuencia absoluta entre el total de datos:
-frecuencia relativa acumulada: Es la suma de las frecuencias relativas hasta el valor actual.
Grafica. ejemplo
1-x (variable)
2-Frecuencia
3-F acumulada
4-F relativa
5-Fra
1-(Variable)
2- Que tanto se repitio
3- Se suma la frecuencia anterior
4- Porcentaje
5- Porcentaje sumando el anterior
Distribución
La manera en la que los datos se muestran. Puede asumir diversas formas. existen familias de distribuciones.
Histograma
Similar a una grafica de barras, pero sus datos se encuentran en intervalos
Campana de Gauss o distribución normal
Cuando tenemos una poblacion grande esa variable tiende a mostrar una distribución nomalr (tiende a formar una campana simetrica). Puede ser asimetrica a la derecha o a la izquierda.
para muestras peuqueñas esta la curva “t” >20
Curtosis
Como se distribuyen los datos en el eje vertical
Tipos de curtosis
-Mesocúrtica: Curtosis normal (como la distribución normal).
-Leptocúrtica: Curtosis alta, distribución muy picuda.
-Platicúrtica Curtosis baja, distribución achatada, colas cortas, Curva más plana y extendida.
Que es la estadistica
Disciplina científica que se ocupa de la obtención, orden y análisis de un conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos observados.
Tipos de estadística:
-Descriptiva: Se encarga de resumir y organizar los datos obtenidos de una muestra o población. Para describir características, como promedios, frecuencias, etc. “El promedio de edad en la clase es de 20 años.”. Interpreta los datos. medidas de tendencia central, medidas de disperción.
-Inferencial: Se encarga de hacer predicciones o generalizaciones a partir de una muestra. Para inferir o estimar cómo es una población entera. “Con base en la muestra, se estima que el 60% aprueba.”
Deducción, inducción.
Deducción: Pasar de algo general a particular
Inducción: Pasar de algo particular a general
Medidas de tendencia central
-Media
-Mediana
-Moda
Las medidas de tendencia central son valores que resumen un conjunto de datos, indicando el valor “típico” o “representativo”
-Promedio
-Mitad cuando los datos estan acomodado
-Dato que mas se repite
Medidas de dispersión (4)
Son valores que indican qué tan dispersos están los datos respecto a la tendencia central
-Rango: Diferencia entre el mayor y menor valor.
-Varianza: Dispersión promedio respecto a la media
-Desviación estándar: Que tanto se alejan los datos del valor central.
-Coeficiente de variación Dispersión relativa en porcentaje
Calcular desviación estándar
One note
Varianza
coeficiente de variación.
Ayuda para exagerar la diferencia
2. Relación entre la disperción estandar y la media aritmetica (expresada en terminos porcentuales. CV= (s o desviación estándar/x) (100)=% si es menor a 30% es homogeneo 31-110 mas o menos, mayor a eso mal.
Error estandar de la muestra (EE)
S o desviación estandar /raiz de n o numero de categorias.