Module 2 Flashcards
(36 cards)
3 types de variables
- variables de personnes (âge, occupation, état civil, habitudes de vie)
- variables de lieux (pays, région)
- variables de temps (durée, fréquence de la maladie)
Classification des variables
- variable quantitative (numériques)
- discrète (ne peut pas être exprimée par fraction)
- continue (peut être exprimée par fraction) - variables qualitatives (qualités, attributs)
3 types d’échelles de classification
- échelle nominale (sexe, groupe sanguin)
- échelle ordinale (satisfaction)
- échelle d’intervalle (âge 1-4, 5-7, etc)
*Passage possible: intervalle -> ordinale -> nominale (sens unique seulement)
Distribution des fréquences dans un tableau
intervalle -> effectif -> fréquence relative -> fréquence relative cumulée
Distribution des fréquences dans un graphique
Échelle nominale ou ordinale
- secteurs proportionnels (pointe de tarte)
- barres proportionnelle (voir p.25 livre)
- en barres (chaque barre représente la fréquence de la classe d’une variable)
Échelle par intervalle
- histogramme (pour les variables quantitatives continues)
- polygone de fréquences (variables continues ou discrètes)
- graphe en ligne (y en fonction de x)
- graphe de percentiles (distribution en 100 parties égales)
Autres représentations
- représentation cartographique
- graphe en point (si extrapolation des valeurs non nécessaire)
Mesure de tendance centrale: les moyennes
Arithmétique: somme des valeurs observées divisée par le nombre de valeur (inconvénient: influencée par les valeurs extrêmes, surtout élevées)
Pondérée: somme des moyennes des classes multipliée par le nombre d’observation par classe
Géométrique: xème racine du produit des valeurs (avantage: réduit l’influence des valeurs extrêmes, surtout basse)
Mesure de tendance centrale: la médiane
Divise en deux parties égales l’ensemble des valeurs en ordre croissant.
Avantage: n’est pas influencée par les valeurs extrêmes; la prioriser lorsque distribution asymétrique
*Si le total des valeurs est pair, faire la moyenne entre les 2 valeurs médianes
Mesure de tendance centrale: le mode
Valeur qui revient le plus souvent
Mesure de dispersion: l’étendu
Différence entre la valeur maximal et la valeur minimal
Inconvénient: ne subit l’influence que des valeurs extrêmes
Mesure de dispersion: quantiles
Diviser l’ensemble en un certain nombre de parties égales
**Données en ordre croissant; quartiles vs quintes vs percentiles
Mesure de dispersion: variance
Somme des carrés des écarts p/r à la moyenne divisée par le nombre d’observation
Mesure de dispersion: écart-type
Racine carrée de la variance
Mesure de dispersion: variation
Rapport de l’écart-type à la moyenne
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle nominale?
Mode
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle ordinale?
Mode, médiane
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle par intervalle?
Mode, médiane, moyenne
Critère d’échantillonnage
Critère d’inclusion (pour guider la sélection des individus, en liens avec l’objectif)
Critère d’exclusion (pour éviter de fausser le résultat, on exclue volontairement les individus)
Taille de l’échantillon (plus on veut augmenter la précision des renseignements recueillis, plus la taille de l’échantillon doit être grande)
à déterminer -> plus petite différence que l’on veut détecter, précision souhaitée, puissance souhaitée, variabilité des données
les 4 méthodes d’échantillonnage
- aléatoire simple (au hasard)
- aléatoire stratifié (au hasard parmi un groupe déterminé selon le contexte)
- systémique (lorsqu’on a un très grand groupe de personnes, sélectionne le xe individu sur la liste selon un chiffre aléatoire de 1-10 puis bonds réguliers pour sélectionné individus)
- en grappes (se déplacer de grappes en grappe selon un protocole établi; “old style”)
Meure de fréquence (rapport): Proportion
Rapport dans lequel les deux entités proviennent du même ensemble et où le numérateur est inclus dans le dénominateur
*Valeur d’une proportion TOUJOURS comprise entre 0-1 soit 0-100%
Mesure de fréquence (rapport): taux
Rapport qui mesure la vitesse ou la force de survenue d’un évènement
*Mesure instantanée
Dénominateur = cumul du temps d’observation de chaque personne/entité -> unité = personne-temps ou distance-temps
Mesure de fréquence (rapport): ratio
Rapport dans lequel le numérateur et le dénominateur proviennent du même ensemble, mais où le numérateur n’est pas compris dans le dénominateur
* le ratio n’a pas d’unité
Mesure de fréquence (rapport): indice
Rapport utilisé lorsque le numérateur n’est pas compris dans le dénominateur et que l’un et l’autre renvoient à deux évènements distincts.
Exemple: décès maternels dus à une cause puerpérale/ nombre de naissance vivante
Mesure en épidémio: Prévalence (P)
Proportion des personnes affectées par cette maladie à un moment donné dans la population
P= m/N soit le nombre de personne malade/ le nombre de personne dans la population
Domaine de variation: 0-1
*Photographie instantanée d’une situation
Mesure en épidémio: Taux d’incidence (I)
Mesure de la vitesse, de la force ou de l’intensité de propagation d’une maladie
I= n/T soit le nombre de nouveaux cas survenus/le cumul du temps de chaque personne à risque de tomber maladie
Domaine de variation: 0-infini
*Représente le nombre de nouveaux cas