Chapitre 2 Statistique Descriptive Flashcards
(25 cards)
Pour la situation identifie La population L'unité statistiques L'échantillon La variable + nature
À la veille d’un examen important un professeur demande aux étudiants d’un de ses groupes de coter de 1 à 5 leur degré de stress
N
l’ensemble des étudiants du professeur
unité statistique
un étudiant du professeur
n
les étudiants du groupe qui a été choisi
X
le degré de stress d’un étudiant face à un examen
nature de la variable qualitative ordinale
Pour la situation identifie La population L'unité statistiques L'échantillon La variable + nature
Dans le cadre du recensement canadien de 2011, on demandait le montant payé par le foyer locataire pour le loyer mensuel du logement
N
Tous les foyers locataire canadien
Unité statistique
Un foyer locataire canadien
n
Aucun
X
Le loyer mensuel du logement d’un foyer locataire canadien, en dollars
Nature variable
Quantitative continue
Paramètre
Statistique
Paramètre pour une population
Statistique pour un échantillon
Par exemple moyenne
Pop : u
Échantillon : x avec une barre sur le dessus
Graphique permis pour les variable quantitative discrète
Diagramme à bâton
Graphique permis pour les variable qualitative continue et discrète si très élevé
Histogramme, polygone de fréquence et ogive
Diagramme à bâtons cité ses caractéristiques
Les valeur de la variable sur l’axe des x
Fréquence absolue ou relative sur l’axe des y
Faire une coupure sur l’axe des abscisse si la valeur = 0 ou la première valeur très grande
Comment on détermine le nombre de classe ?
Étape 1 : déterminer le nombre de classe grâce à la règle de Sturges ou k représente le nombre de classe.
k~1+3,322log(n ou pop)
On arrondit à l’entier
Étape 2
On calcule l’amplitude grâce à la formule
A= étendu/nombre de classe soit E/k
Étape 3 déterminer la borne inférieur de préférence un multiple de 5 ou un nombre pair
Histogramme caractéristiques
La variable sur l’axe des x
Fréquence absolue ou relative sur l’axe des y
Les rectangle se touche et ont la même largeur
Polygone de fréquences (polygone des effectifs)
On ajoute une classe de fréquences nulle avant la première classe du tableau et une autre après la dernière
On utilise le milieu de chaque classe comme représentant
Coordonnées (x;y) = (milieu de la classe; fréquence de la classe
Fréquence relative ou absolue
Ogive caractéristiques
Courbe fréquence absolue ou relative cumulés
Le point de départ égale tjrs 0
Les autre point de l’ogive ont comme coordonnées la borne supérieur d’une classe et la fréquence absolue ou relative cumulés y correspondant
Comment donner la signification contextuelle du mode
EXEMPLE
Une majorité (%) des 159 employés de l’échantillon ont le français comme langue maternelle
Comment donner la signification contextuelle de la médiane
Exemple
6,7,8,8,10,11 | 11,11,12,13,14,15
Au moins 50%des 12 étudiants du groupe 02 de l’échantillon ont obtenu un résultat inférieur ou égal à 11pts sur 15 pour le test (8/12 ont eu 11 donc il y a plus de 50%)
A,A,B,B,B,B | C,C,D,D,D,E
50% des 12 étudiants du cours de statistique ont eu un résultat de A ou B à leur mini test
Quel sont les méthode pour déterminer la médiane ?
Lecture sur l’ogive (méthode graphique ) c’est une estimations (environ 50%)
La règle de trois (méthode analytique ) pour valeur regroupé par classe
Pour valeur non groupé par classe
Impair : (n+1)/2
Pair : la médiane est la moyenne des données de rang n/2 et n/2+1
Comment donner la signification contextuelle de la moyenne
Les 33 étudiant du cour de stat ont obtenu un résultat moyen d’environ 79,2 pts
Avantage et inconvénients du mode
Avantage:
+Simple à trouver et interpréter
+S’applique à tout les types de variable
+N’est pas influencer par les valeurs extrêmes, n’en dépend pas
+Représente bien la série si il s’y retrouve en abondance
Inconvénients
+Pas pratique avec peu de données
+Dans le cas de données classées, il est influencé par le choix des classe ???
+Une série peut avoir plusieurs mode signification moins intéressante
Avantage et caractéristiques médiane
Avantage :
+Ne dépend pas de la valeur des données mais de leur position
+N’est pas affecté par les valeurs extrêmes (très pratique pour une série dissymétrique
Inconvénients :
+Ne tient pas compte de la valeur des données
+Possède aucune propriété algébrique
+Ne s’applique pas à une variable qualitative nominale
Avantage et inconvénients de la moyenne
Avantage :
+Tient compte de toute les données et valeur
+Permet certains calcul algébrique
+Valeur relativement stable d’un échantillon à l’autre
Inconvénients
+Sensible au valeur extrêmes
+Ne s’applique pas à une variable qualitative
Égualité parmi les quartiles
Me=Q2=D5=C10
Comment déterminer les quartiles
Par lecture sur l’ogive
Règle de trois (pour donné regroupé par classe
Donné brutes : on peut multiplier le nombre de données par le pourcentage du quantile pour trouver le rang ( attention !!!! Ne fonctionne qu’avec beaucoup de données minimum 10) sinon faire comme avec la médiane
Signification contextuelle d’un quantile
Environ 25% des 80 piles de l’échantillon ont une durée de vie inférieur ou égal à 20 heures
Plus l’écart type est petit…..
Plus les données sont concentrés autour de la moyenne
Plus l’écart type est grand……
Plus les données sont dispersés autour de la moyenne
Qu’est ce qui est mieux, l’écart type ou l’étendue ?
L’écart type
l’étendue est influencé par les valeurs extrêmes d’une série.
Comment on calcule la côte z à quoi ça sert ?
La côte z donne la mesure de l’écart entre une données et la moyenne de la série statistique en écart type
Côte z = (x-moyenne)/l’écart type