Cours 2 - Présentation des données Flashcards
(45 cards)
Sous quelles forme peut-on illustrer les données?
- Tableau de contingence (ou de fréquence)
- Graphiques (histogramme)
Qu’est-ce qu’une série statistique simple?
Donner un exemple.
Une seule variable observée (mesurée) pour un ensemble d’éléments (l’échantillon)
Concentration plasmatique en cholestérol sur l’ensemble n de sujets
Qu’est-ce qu’une série statistique double-triple-etc?
On mesure de multiples variables sur chaque élément
Âge, sexe, genre du sujet, etc
Qu’est-ce qu’une série statistique double-triple-etc?
On mesure de multiples variables sur chaque élément
Âge, sexe, genre du sujet, etc
Qu’est-ce qu’un tableau de contingence?
Un tableau à plusieurs dimensions (variable)
Qu’est-ce qu’un tableau de contingence?
Un tableau à plusieurs dimensions (variable)
Qu’est-ce qu’un diagramme à bâtons?
C’est une diagramme pour des variables qualitatives ou semi-quantitatives ou les variables quantitatives discrètes (si nombre de classes est restreint). Permet de visualiser un jeu de données.
Quelles sont les étapes de construction d’un histogramme?
- Calcul du nombre de classes
- Calcul de l’intervalle de classe
- Identifier les bornes des classes
- Attribuer chacune des observations à une seule classe
- Compter combien d’observations sont présentes dans chaque classe
- Vérifier que la somme des fréquences absolues est égale à n
- Identifier la classe qui a le plus de valeurs pour déterminer la borne supérieure de l’axe des y (fréquence absolue)
- Dessiner la structure de l’histogramme avec l’axe des x et y
- Dessiner le bâton pour chacune des classes en fonctions de sa fréquence absolue
Comment calculer le nombre de classes pour construire un histogramme?
Règle de Sturges : Nb de classes = 1 + 3.3*log(n)
Règle de Yule : Nb de classes = 2.5*4racine(n)
On arrondit à l’entier supérieur dans les 2 cas.
Comment calculer l’intervalle des classes pour construire un histogramme?
h = étendue de variation / nb de classes
étendue de variation : max - min
Comment identifier les bornes pour construire un histogramme?
Il faut faire coïncider les bornes et indices de classes avec des nombres comportant peu de décimales (chiffres ronds).
Avec des variables quantitatives : histogramme
Qu’est-ce que la fréquence absolue ou l’effectif de classe?
Le nombre d’éléments appartenant à chaque classe
Qu’est-ce que la fréquence absolue ou l’effectif de classe?
Le nombre d’éléments appartenant à chaque classe
Que permet le diagramme à moustache?
D’illustrer des données quantitatives
Qu’est que le diagramme à moustache mets en lumière?
- Médiane
- Écart interquartile
- Étendue de variation
- Valeurs extrêmes
Que représente le premier quartile ?
25% des observations ont une valeur inférieure au 1er quartile
Que représente la médiane?
50% des observations ont une valeur supérieure à la médiane
Que représente le troisième quartile?
25% des observations ont une valeur supérieure au 3e quartile
Qu’est-ce que sont des séries statistiques doubles et que comprennent-elles?
Un ensemble d’éléments pour lesquels on a observé ou mesuré 2 variables.
1re variable : aléatoire
2e variable : aléatoire ou contrôlées
Donne des exemples de séries statistiques doubles
- Variable contrôlée est la dose d’hormone injectée et la variable aléatoire est le rythme cardiaque mesuré
- 2 variables aléatoires : nombre de colonies et couleurs de colonies
Dans une série de statistique double quel type de diagramme doit-on tracer lorsque les deux variables sont quantitatives?
Un diagramme de dispersion
Quels sont les 3 paramètres de positions faisant partie de paramètres d’une distribution ?
- Moyenne
- Médiane
- Mode
Que sont les paramètres de position?
Ce sont les valeurs centrales autour desquelles se groupent les valeurs observées
Que sont les paramètres de dispersion?
Renseignent quant à l’étalement de la distribution des valeurs autour des valeurs centrales