statistiques descriptives Flashcards

(114 cards)

1
Q

quel est le but des statistiques?

A

=> répondre à une question concernant un collectif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

une statistique ?

A

= état quantitatif qui décrit une caractéristique de la pop étudiée en se basant sur des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

la statistique ?

A

= ensemble des méthodes permettant de réaliser de présenter d’analyser un état quantitatif afin de repondre a la question posée concernant un collectif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

population ?

A
  • ensemble sur lequel porte l’étude statistique = collectif
  • peut être trans-temporelle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

individus

A
  • = éléments qui coomposent la population
  • =mt appelé ind statistique ou unité satistiques
  • peuvent être des objets ou vivant
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

échantillon

A

= une partie de la pop

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

variable aléatoire

ou caractère étudié

A

= propriétés qu’on va observer chez ind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

modalités

A
  • les différentes valeurs prises par la variable
  • il existe différents types de variables aléatoire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

variable aléatoire nominale

(caractériser par un nom)

A
  • propriété étudiée est non chiffrable = qui ne peut pas se mesurer/ se chiffrer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

que ne peut- on pas utilisé pour les variables aléatoire qualitative?

A

on ne peut PAS utiliser les indicateurs numériques SAUF les variables et les modes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

est-ce qu’on peut dire qu’il y a une infinité dénombrable en theorie?

A

oui, mais en pratique on a unnombre fini de valeurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

variable aléatoire quantitative

A
  • propriété étudiée est une variable numérique = qui peut se mesurer/ se chiffrer
  • 2 types : VA quantitatives discrètes
    VA quantitatives continues
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

VA quantitatives discrètes

A
  • elles sont dénombrables
  • prennent qu’un nombre fini de valeurs en pratique (mais en théorie une infinité dénombrale°
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

VA quantitatives continues

A
  • elles sont indénombrables
  • elles peuvent prendre toutes les valeurs possibles: finité de modalité possible
  • peuvent discrétisées en classes = VA quantitatives continues que l’on rassemble dans desintervalles [vinf ; vsup[
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quels sont les 4 grands principes pour réaliser une bonne études statistiques

A
  1. bien poser le problème: une question unique, contexte précis
  2. observations non biaisée : on réalise l’étude au plus près des réalités
  3. méthodes adaptées et définies: respect des conditions de validité / assurer honnêté des présentation
  4. conclusions claires avec intervalles d’incertitudes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

les stat ont-elles des limites?

A

oui, qui sont la causes de méfiance de la pop et qui déteriorent réputation des stat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

comment appelle-t-on le fait de faire pencher le résultat en sa faveur ?

A

= biais volontaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

c’est quoi le biais volontaire?

A

le fait de faire pencher les résultats en sa faveur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

echantillonage c’est quoi?

A
  • on n’étudie qu’un échantillon de la pop
  • induit un écart aléatoire de réponse
    • échantillon est grand - il y a de fluctuations
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

problème de l’echantillonage ?

A

comme on n’étudie qu’un échantillon il n’est pas identique à la population et les réponses diffèrent d’un échantillon à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

comment on sait que échantillon estreprésentatif de la pop ?

A

c’est avoir un écart de réponse le + petit qu’il soit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

que nécessite une représentavité de la pop?

A

il faut une équité de choix : chaque personne a la même probabilité de chance d’être intégrée dans l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

comment faire pour avoir une équité de choix

A

on effectue une randomisation : on prend des ind au hasard, il faut que tout le monde est la même chance d’être intégrer dans l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

que fait-on quand équité est respecté?

A

une analyse probabiliste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
comment note-on une variable?
V
26
comment note-on une modalité
M
27
comment note-on les **modalité de V indicée**
J(1àM)
28
comme note-on la taille de l'échantillon?
N
29
comment note-on l'ind indicé
I(1 à N)
30
comment note-on la valeur de V pour l'ind i
Vi
31
une classe c'est quoi ?
une modalité d'expression
32
c'est quoi la valeur représentative d'une classe?
c'est le centre de la classe
33
formule de la modalité d'une classe
vj = vsup + vinf /2
34
à quoi correspond l'effectif | (de la modalité vj de V)
* note nj * = nombre d'ind de l'échantillon ayant comme modalité vj
35
à quoi correspond l'effectif total
* = le nombre d'individus de l'échantillon * souvent noté N
36
à quoi correspond la fréquence | ( de la modalité vj de V)
* noté fj * = fraction d'ind de l'échantillon ayant comme modalité vj * = rapport de l'effectif d'une modalité par l'effectif total
37
formule de la fréquence ?
fj= nj/N ∈ [0;1] | **en multipliant fréquence par 100, on obtient fréquence en %**
38
avec quelles variables on peut utilisées la fréquence
quantitative **ou** qualitative
39
la moyenne c'est quoi ?
* noté m*e* * =quotient de la sommes de toutes les valeurs de la serie par l"effectif total N
40
avec quoi on peut calculer la moyenne ? | autre chose que l'effectif
avec la fréquence pour des valeurs par classes m*e*=*f*1v1+*f*2v2...+*f*MvM | V= modalité
41
à quoi est sensible la moyenne ?
aux valeurs extrêmes elle donne une taille typique =mesure de la tendance centrale
42
la médiane ou centile 50
* noté m*ed* ou C*50* * = au nombre qui sépare la serie statistique en deux * 50% valeurs en dessous de la médiane et 50% au dessus
43
la médiane peut-elle être une valeur qui ne soit pas dans la série ?
oui
44
que nécessite la médiane
il faut ordonner modalité vi avant de la calculer
45
si n est pair comment savoir la médiane ?
on prend la moyenne des 2 valeurs du milieu K=N/2 C*50*=(Vk+1)/2
46
si n est impair comment savoir la médiane?
K=(N-1)/2 et C*50*=Vk+1
47
la médiane est... .... d'où son utilisation en biologie
insensible au valeurs extrêmes
48
que ce passe-t-il si on a des valeurs **symétriques** ? | pour la moyenne et la médiane
la moyenne et la médiane seront identique!
49
que ce passe-t-il si les valeurs sont asymétrique
* c'est un indice d'asymétrie * la médiane et la moyenne seront différenes
50
c'est quoi le mode ?
= la modalité vj de la variable ayant un maximum local de fréquence ## Footnote =modalité ayant + grand nombre d'effectif ou la plus gde fréquence localemt
51
comment appelle-t-on le mode pour une VA quantitative | (discrétisée en classe)
on parle de **classe modale**
52
c'est quoi la distribution multimodale | (bimodalte, trimodale...)
il peut avoir plusieurs sommets( plusieurs effectifs / fréquences qui ressortent) il y a **autant de modes que de pics** | même si sommet pas égaux chaque sommet est considéré comme un mode
53
c'est quoi la variance? | (d'échantillon)
* notée Se^2 * =mesure de dispersion des valeurs de V par rapport à la moyenne
54
variance formule | =moyenne des carrés des écarts entre la modalité vi et la moyenne m*e*
Se² = n1(x1-m*e*)²+...+n*n*(x*n*-m*e*)² / N
55
formule écart entre la moyenne de la variable au carré et la moyenne au carré :
Se^2 = n1x1^2+...n*n*x*n*^2/N - m*e*^2
56
formule variance de la fréquence | pour des valeurs classés
Se^2= (f1.x1^2)+...+ (fn.xn^2)-m*e*^2
57
par quoi est attiré la médiane ?
par le pic modal (elle se rapproche des valeurs avec beaucoup d'effectif) | cf p26 cours imprimé du tutorat
58
par quoi est attiré la moyenne ?
la traîne (elles est plus sensible aux valeurs extrèmes) | cf p26 cours imprimé du tutorat
59
comment sont les résultats de la variance?
la variance donne les résultat au carré
60
que caractérise l'écart type?
* la dispersion des valeurs autour de la moyenne * c'est la racine carré de la variance * on conserve l'unité
61
formule écart type ?
√Se^2
62
que fait-on quand on normalise valeurs de la VA?
* on divise les valeurs de la VA * on prend Se pour unité * **V'=V/Se** Se sans unité
63
c'est quoi l'étendue ?
la différence entre la modalité de la variable la plus élevée et la modalité de la variable la plus basse
64
formule de l'étendue?
etendue = max(vi)-min(vi)
65
c'est quoi la valeur absolue
= moyenne de la valur absolue des écart de la moyenne
66
particularité l'écart moyen en valeur absolu?
* il conserve l'unité * il peut donner idée de la valeur de la valeur absolue
67
# indicateurs de liaison_ la covariance c'est quoi ?
* =indicateur de liaison de 2 caractères **quantitatifs** X et Y * il permet d'établir un lien ou non entre 2 variables * caratérise une relation linéaire endtre 2 variables
68
# indicateurs de liaison_ formule de la covariance
= écart entre la moyenne des produits de X et Y et le produit des moyennes de X et de Y cov*exy* = (1/N Σ x*i*.y*i*)-x*e*.y*e*
69
# indicateurs de liaison_ qu'obtient-on avec la covariance?
une unité bizarre qui correspond à l'association des uintés de chaque variable
70
# indicateurs de liaison_ la corrélation c'est quoi?
=au rapport de la covariance de X et de Y par le produit des écarts types de X et de Y
71
# indicateurs de liaison_ formule corrélation
corr*exy*= cov*Exy*/ Sex.Sey
72
# indicateurs de liaison_ qu'obtient-on avec la corrélation?
* une mesure **sans unité** et **sans dimension** * indépendante du choix d'unité, on peut donc s'affranchir des unité
73
# indicateurs de liaison_ comment seront les valuers de la corrélation?
entre -1 et +1
74
# indicateurs de liaison_ valeur de la correlation si il n'y a **pas** de correlation?
* =0 * X varie indépendamment de Y=> les deux variables sont indépendantes
75
# indicateurs de liaison_ si corrélation est positive ?
* les 2 variables se suivent dans le même sens * X augmente quand Y augmente et inversement
76
si corrélation est négative
les 2 variables se suivent en sens opposé X diminue quand Y augmente ou inversemnt
77
si 'lon a une relation linéaire/ de proportionnalité
* on obtient -1lorsque X et Y sont **inversement** proprtionnels parfait * on obtien +1 lorsque X et Y sont **proportionnels** parfaits
78
pourquoi les tables sont intéresantes à étudier?
elles donnent une information morphologique élevée sur la répartition des valeurs de V
79
les tables de fréquences simples montrent quoi?
* effectif nj et/ou fréquence fj associé a la modalité (lignes) * m modlaités d'une variable V (colonnes) | cf p 29 cours tuto imprimés
80
à quoi servent les tables de fréquences simples?
donner la répartion des valeurs de chaques classes
81
les tables de fréquences cumulées c'est quoi?
chaque effectif remplacé par la somme de tous les précédents pour les tables cumulées **croissantes** ou la somme de tous les suivants pour les tables cumulées **décroissantes** | cf p 30 cours tuto imprimé
82
À quoi servent les tables croisées? | (ou de contingence)
à **visualiser la relation entre 2 variables** quantitatives ou entre 2 variables qualitative
83
comment on fait une table croisée?
* **en tête de colonne** on met les modalités m1*j* de la variable 1 * **en tête de ligne** on met les modalités m2*k* * d**ans chaque case** se place effectif/ou fréquence de la combianison des modalités m1*j* et m2*k* | cf p 31 cours tuto imprimé
84
que représente une marge ?
=totaux d'une ligne ou d'une colonne donc d'une m1*j* ou m2*k*
85
que représente les totaux d'une ligne ou d'une colonne
une marge
86
comment appelle-t-on les valeurs qu'on obtient suite à la marge ?
les valeurs marginales
87
c'est quoi les valeurs marginales ?
c'est les valeurs qu'on obtient suite à la marge
88
que montrent les tables croisées?
elles montrent un lien possible entre les variables = relation de dépendance
89
c'est quoi une relation de dépendance ?
un lien possible entre les variables
90
quelle information vont donner les graphiques ?
m^me info que les tables, mais on a appréciation visuelles instantanée=> risque d'erreurs d'interprétation
91
le graphique en barre c'est quoi ?
* comme un histogramme sauf que **seule hauteur des barres compte, surface des barres n'a aucune importantce )
92
on l'utilise avec quelle types de variables ?
quantitative ou qualitative , mais il est + interessant avec var qualitatice
93
au niveau de l'axe des abscisses et ordonnées que va-t-on retrouvés pour graphique en barre ?
* axe abs : modalités de la var * axe ordo : effectifs
94
c'est quoi le graphique en batons ?
même que celui en barre mais on peut utiliser plus de modalités. effectifs proportionelles aux hauteurs
95
pour quelle type de variables graphique en bâtons est utilisé ?
var quantitative discrètes
96
graphique des centiles c'est pour quel type de variables ?
var quantitatives
97
que va-t-on avoir sur l'axe des abscisses et des ordonnées pour graphique centile ?
la série de valeurs (n valeurs *vi*) est placée au préalabe dasn ordre csst * axe abs: n valeurs de *vi* mises en ordre * axe ordo: graduations de 0 à 1 correspondant aux centiles
98
que va-t-on imaginer pour graphique des centiles ?
un escalier à n marches, hauteur marche = 1/n. un point est placé au milieu de la montée d'une marche escalier peut-être éffacé si on a peu de point centile de valeur k est obtenu en rendant la valeur d'abscisse qui donne k/100 À chaque fois qu'on monte une marche =1ne valeur | voir p 32 cours imp tuto
99
le graphique des centils est il une courbe ?
non c'est une suite de points
100
# grap des centiles que ce passe-t-il qaund la pente est forte ?
il y a bcp d'ind quand pente est faible on a peu d'ind
101
le graphique des centiles c'est l'image expérimentale de quoi ?
fonction de repartition ( var quanti discèrete )car il montre répartition cumulée.
102
quels sont les avantages qu graphique du centiles ?
* pas nécessaire de mettre en classe * on voit directement où il y a le plus de valuers (la pente est forte donc bcp de valeurs)
103
avec quelle var on va utiliser le graphique cartesien ou XY ?
var quanti continues ou discrètex
104
que permet le graphique cartésien ?
* mettre en relation 2 var X et y quanti * étude corrélation des 2 var
105
que va-t-il avoir en abs et en ordo pour graph cartésien ?
* abs :variable X * ordonée var Y * un ind est représenté par un point de coordonée (xi,yi)
106
dans le graph cartésien que va-t-on regarder pour étudier ce graph ?
* linéarilité ou non du nuage de points . * si points sont ordonées => dépendance * ce grap permet de ne pas calculer à mauvais escient une corrélation linéaire
107
quelle var pour histogramme ?
caractères quantitatif continue discrétisée en classes => var continues
108
c'est quoi un histogramme ?
* effectifs de la var sont répartis en classe * surface des rectangles proportionelle à l'effectif total et la surface de chaque rectangle est proportionelle à l'effectif de la classe * représentation expérimentale de la fonction de densité
109
quand les effectifs vont êtres proportionnelles aux hauteurs pour graph histo ?
quand les classes sont de mêmes largeurs
110
c'est quoi un polygone de fréquence ?
* obtenu en traçant des segments joignant les milieux des sommets des rectangles * surface sous les polygones = surface des rectangles * correspond à une fonction de densité
111
quels graphique utilisé pour graphique de fréquence ?
graphique circulaire
112
que permet de visualiser le graph circulaire ?
l'importance d'un modalité pour un tout = repérer les parties d'un tous
113
quelle est sa forme au graph circulaire ?
* un disque dont la surface correspond à la taille de l'échantillon * le secteur du disque et son angle est proportionnel à la fréquence de la modalité ou à l'effectif * possible convertir en histo mais moins bien et var doit être continue discrétisée en classe
114
quels sont les autres graphiques ?
* courbes ( X et Y quantitatives) * graphes polaires (r quantitatif) * À boîtes à moustaches ( Y quantitatif, X quantitatif classé ou quali ) * en violons (var qaunti )