Module 2A: Questions, objectifs et hypothèses de recherche Flashcards
(43 cards)
Variable:
Caractéristique susceptible d’être différente selon les personnes, lieux ou temps
Valeur:
Tout état que prend la variable
(ex: variable sexe → 2 valeurs, masculin/féminin)
Types de variables: (3)
- Variables de personnes: attributs anatomiques, physiologiques, sociaux, économiques, culturels
- Variables de lieux: pays, régiom, situation géographique
- Variables de temps: quand?
Classification des variables: (2 types, 2 sous-types chaque)
-
Variable quantitative: numérique
- Discrète → uniquement nombres entiers (ex: # d’enfants)
- Variable → continue, contient des fractions (ex: taille)
-
Variable qualitative: attributs, toujours discrète
- Dichotomique → possèdent que deux modalités
- Ordinale → avec séquence claire
Moyenne vs. proportion:
Moyenne: valeurs quantitatives
Proportion: valeurs qualitatives
Échelle de classification:
Doit permettre de distribuer toutes les observations (chacune dans une seule catégorie)
Échelle de classification:
Doit permettre de distribuer toutes les observations (chacune dans une seule catégorie)
Deux conditions pour assurer que le classification des observations est juste:
- Mutuellement exclusives: each data point can only be in one class
- Collectivement exhaustives: must apply to all data
Trois types d’échelles de classification:
- Échelle nominale: classes sont nommées
- Échelle ordinale: classes sont nommées et ordonnées (plus petit → plus grand ou vice versa)
- Échelle par intervalle: nommées et ordonnées et une relation de distance entre les valeurs
Passage d’une échelle → une autre:
Each pass down = more data lost, therefore becomes +++ general
individuel (6 years old) → intervalle (1-7 years old) → ordinale (school-aged child) → nominale (child)
Distributions de fréquences:
Rend les données plus claires et intelligibles
Fréquence absolue:
= #observations/classe
Colonnes dans tableau de distribution de fréquences: 4
- Classes
- Effectif/fréquence absolue
- Fréquence relative (% de répartition des effectifs dans les classes) → 10/70 people = 12.8%
- Fréquence relative cumulée (additionne fréquence relative des classes, % in that class and those above it)
Représentation graphique: échelle nominale/ordinale
-
Diagramme en secteurs proportionnelles (pie graph)
- Proportions des valeurs prises par une variable
- Seulement une série de données
-
Diagramme en barres proportionnelles
- Analogue à la représentation par tarte
-
Diagramme en barres
- Chaque barre représente fréquence de la classe d’une variable
Représentation graphique: échelle par intervalle (4)
-
L’histogramme:
- Utilisée pour variables quantitatives continue:
-
Chaque rectangle doit:
- Suivent l’ordre des classes
- Base coïncide avec l’intervalle de la classe correspondante
- Aire de rectangle = fréquence de la classe correspondante
-
Chaque rectangle doit:
- Utilisée pour variables quantitatives continue:
-
Polygone de fréquences:
- Utilisée pour variables continue et discrètes mais réservée pour les variables continues
- Obtenu par passer ligne par milieu des sommets des rectangles de l’histogramme
-
Graphe en lignes:
- Variable y en fonction d’une variable x
-
Graphe des percentiles:
- Partagent une distribution en 100 parties égales entre elles
Règles générales de représentation graphique
- Doivent êtres aussi simples que possible
- Titre clair, concis, et précis
- Échelle et unités spécifiques
- Sources indiquées
- Légende ajoutée si nécessaire
IMPORTANT D’ÉVITER SOUTE SURCHARGE
Trois mésures de tendance centrale:
- Moyenne
- Médiane
- Mode
Moyenne arithmétique:
Somme des valeurs observées/nombre de valeurs
Lacune de la moyenne arithmétique:
- Influencée +++ par des valeurs extrêmes (surtout élevées)
- Mais dim. quand tu aug. # d’observations
Moyenne pondérée:
Donne un poids à chaque classe selon son importance dans l’ensemble
somme des (moyennes des classes x par nombre d’observations) / nombre total d’observations
Moyenne géométrique:
- Utilise produit des valeurs observées
- Seulement valeurs positives
- Permet de réduire l’influence des valeurs extrêmes (surtout basses)
- Utilisée dans contexte d’analyses de laboratoires (svt asymétriques)
Comportement des moyennes arithmétiques vs. géométriques en présence de valeurs extrêmes:
Médiane:
- N’est pas influencée par valeurs extrêmes
- Préfère aux autres mesures si distribution est +++ asymétrique
Mode:
VALEUR QUI REVIENT LE + SOUVENT
- Influencé par les fréquences des observations
- Plus sensible aux changements
- Moins stable que la moyenne
- Utilisée pour variables qualitatives et quantitatives