cours 2 Flashcards
présentation des données (41 cards)
vrai ou faux
L’étendue des données collectées est souvent trop grande pour en déduire les
caractéristiques ou les tendances globales par un examen visuel rapide.
vrai
but du cours 2
étudier comment à partir de tableaux et de graphiques on peut:
* Résumer les principales caractéristiques de la distribution des données;
* Comparer la composition, la moyenne, la variabilité de plusieurs groupes;
* Mettre en évidence des relations entre variables;
* Détecter des valeurs exceptionnelles ou aberrantes;
* Estimer des probabilités d’évènements;
* Détecter les lois qui régissent le phénomène à l’étude
série statistique simple
une seule variable observée (mesurée) pour un
ensemble d’éléments (l’échantillon).
série statistique douple/triple/etc
on observe alors deux, trois, ou de multiples variables sur chaque élément
qu’arrive t-il si la variable est quantitative ou semi-quantitative
chaque niveau (catégorie)
représente une classe d’observations. On dénombre alors les éléments de chaque
classe, puis on peut les représenter sous forme de tableau de contingence ou de
diagramme en bâtons
outils de visualisation
tableau de contigence
diagramme en bâton
histogramme
diagramme en moustache
tableau de contigence
Il est possible de faire des tableaux à plusieurs dimensions, simplement en ajoutant des variables
on peut créer le tableau avec la fonction table()
diagramme en bâton
Pour les variables qualitatives ou semi-quantitatives.
Peut aussi être utilisé pour les variables quantitatives discrètes (si le nombre de classes est restreint)
Par contre, pour tout graphique, il faut prendre l’habitude de
fournir un titre et des noms d’axes
étapes de construction d’un histogramme
- Calcul du nombre de classes
- Calcul de l’intervalle de classe
- Identifier les bornes des classes
- Attribuer chacune des observations à une seule classe
- Compter combien d’observations sont présentes dans chaque
classe - Vérifier que la somme des fréquences absolues est bien égale
à n (nombre d’observations) - Identifier la classe qui a le plus de valeurs pour déterminer la
borne supérieure de l’axe des y (fréquence absolue) - Dessiner la structure de l’histogramme avec l’axe des x et y
- Dessiner le bâton pour chacune des classes en fonctions de
sa fréquence absolue
- Calcul du nombre de classes
Pour les variables quantitatives continues, ou les variables
discrètes qui ont trop de classes, il faut diviser la plage de variation en classes et assigner chaque élément à une de ces classes.
règle de Sturges
Nb de classes = 1 + 3.3*log10n
règle de Yule
Nb de classes = 2.54racine carré de n
comment identifier l’intervalle de classe
h = étendue de variation / nb de classes
étendue de variation
max – min
par quoi est définie une classe
par sa borne inférieure et sa borne supérieure
borne inférieure de la première classe
devrait coïncider environ avec le min des données.
bornes inférieures des autres classes
déterminées par additions
successives de h.
indices de classe
valeurs centrales des classes (si l’intervalle de
classe est 1, les indices seront 0.5, 1.5, 2.5, etc.
- Identifier les bornes
Il faut faire coïncider les bornes et indices de classes avec des nombres
comportant peu de décimales (des chiffres “ronds”).
Il est rare qu’il soit justifié d’avoir des classes inégales.
Les classes ne doivent jamais se chevaucher.
fréquence absolue ou effectif de la classe
Le nombre d’éléments appartenant à chaque classe
diagramme à moustache
Autre façon très utilisée d’illustrer des données quantitatives.
Illustre la médiane, l’écart interquartile, l’étendue de variation, et les valeurs extrêmes
écart interquartile
intervalle entre 1er et 3e quartile (qui comprend donc 50% des observations)
série statistique double
Correspond à un ensemble d’éléments pour lesquels on a observé/mesuré deux
variables
Pour avoir une série statistique, il faut au moins une variable aléatoire.
La seconde variable peut être aléatoire ou contrôlée
pour représenter les séries statistiques doubles graphiquement
Si on a une variable quantitative et une variable qualitative ou semi-quantitative: série d’histogrammes ou de diagramme en bâtons, ou de diagrammes à moustache
Si les deux variables sont quantitatives, on devrait tracer un diagramme de
dispersion.