Statistiques Flashcards
(41 cards)
Qu’est-ce qu’une variable ?
Valeur se mesurant avec instrument mesure
Qu’est-ce qu’une variable quantitative et quelles sont ses caractéristiques ?
Valeur numérique
Discrète : valeurs variables = qté isolées
Continue : infinité valeurs possibles
Qu’est-ce qu’une variable qualitative et quelles sont ses caractéristiques ?
Attributs pas soumis aux lois arithmétiques
Nominales : attributs ne se prêtant pas à mise en rang
Ordinales : ordre naturel entre attribut
Dichotomique : seulement 2 catégories
Polychotomique : pls catégories
Qu’est-ce qu’une statistique descriptive ?
- Ensemble observations de façon concise, extraire faits saillants et exprimé sous forme synthèse
- Décrire observations recueillies par indice numérique ou tableau/graphique
À quoi servent les variables qualitatives dans la statistique descriptive ?
- Rapporter fréquences absolue et relative pr résumer distribution
- Seulement qq valeurs différentes –> fréquences peuvent être rapportées ds un texte
- Peut être représenté par diagramme en bâton
- Peut calculer mode, mais pas moyenne ou médiane
Qu’est-ce que la fréquence absolue ?
Nb observations de cette catégorie
Qu’est-ce que la fréquence relative ?
% ou proportion obtenue par division fréquence absolue par nb total observation
À quoi servent les différents types de variables quantitatives dans la statistique descriptive ?
Discrète : fréquence absolue et relative s’appliquent
Continue
- Regrouper différentes valeurs en classes mutuellement exclusives et idéalement largeur égales
- Tableau fréquence peut faciliter lecture puis présentation par histogramme (contiguïté rectangles pr refléter caractère continu variable)
- Peut être aussi décrite par qq indices numériques donnant + info sur tendance centrale et dispersion
Qu’est-ce que des quartiles ?
Séparation en 4 parties égales quant au nb observations qu’elles contiennent
Qu’est-ce que la tendance centrale et quels sont ses types ?
Tendance à se concentrer
Moyenne arithmétique : centre gravité histogramme
Médiane : valeur sous laquelle on retrouve 50% observations
Mode : correspond au sommet histogramme (unimodale = un seul mode)
Quels sont les distributions possibles d’un histogramme ?
- Symétrique et unimodale –> moyenne = médiane = mode
- distribution est asymétrique, + 3 mesures ont valeurs différentes
- Utilise moyenne qd distribution symétrique et médiane si forte asymétrie
Quelles sont les 3 façons de calculer la dispersion ?
Étendue : différence entre + grande et + petite valeur
Variance : écart données par rapport à moyenne
Écart type : indice de dispersion le + fréquemment utilisé
Comment calcule-t-on la variance ?
n-1
Comment calcule-t-on l’écart-type ?
Racine carré variance (DESCRIPTIVE)
Comment représente-t-on graphiquement la relation entre deux variables quantitatives ?
Diagramme de dispersion (nuage de points) où chaque point correspond à paire résultat observé chez sujet particulier
Qu’est-ce qu’un corrélation?
- Indice numérique permettant quantifier relation linéaire entre 2 variables
- Nb sans unité compris entre -1 et +1
- Négatif si valeurs élevées d’un correspond valeurs basses autre
- Positif si valeurs élevées d’un correspond valeurs élevées autre
- Nulle si valeurs d’un associées à valeurs faibles ET élevées de l’autre
- Reflète force association linéaire entre 2 variables
- Permet pas établir sens association (lien de causalité)
Comment représente-t-on la relation entre deux variables qualitatives ?
Relation présentée à l’aide tableau de contingence
X Y A 34 3 B 10 28 C 2 22
Qu’est-ce que la statistique inférentielle ?
- Émettre conclusion valable pr ensemble pop à partir échantillon représentatif pop
- Repose sur théorie probabilité
Quelles sont les lois de la probabilité ?
Probabilité = nb entre 0 et 1
Règle #1 : probabilité qu’un des 2 évènements mutuellement exclusifs (peuvent pas se produire simultanément) se produise = somme probabilité respectives
Règle #2 : évènement contraire est = 1 - probabilité évènement
Règle #3 : probabilité que 2 évènements indépendants se produisent = produit probabilité respective
Qu’est-ce que la distribution normale ?
- Décrit grand nb phénomène naturel
- Seulement variables quantitatives et continues
- Représentées à aide histogramme
- Variable X suit distribution normale avec moyenne x et ET y (X ~ N (x, y)
- Transformer distributions normales en centrée réduite –> Z = (X- x)/y
Quelle est la forme caractéristique de la distribution normale ?
Symétrique et unimodale
Moyenne, médiane et mode identiques
Aire sous courbe = 1
Qu’est-ce que la distribution normale centrée réduite ?
Moyenne est 0 et ET = 1 –> Z ~ N (0, 1)
Quel est le lien entre la moyenne et l’écart type ?
Moyenne +/- 1ET : comprend 68% aire totale
Moyenne +/- 2ET : comprend 95% aire totale
Moyenne +/- 3ET : comprend 99,8% aire totale
Est-ce qu’une estimation avec un échantillon représentatif donne toujours la valeur réelle ?
Non parce que c’est rare que estimation = valeur réelle paramètre inconnu mm si échantillon représentatif