Cours 2: Description des données Flashcards

(51 cards)

1
Q

Quelles sont les 3 fonctions de la représentation graphique?

A
  1. Organisr les données selon un ordre logique
  2. Examiner la forme de la distribution
  3. Déterminer s’il existe des données extrêmes/aberrantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nomme les 4 types de représentationa graphiques utilisées en statistiques.

A
  1. Distribution de fréquences
  2. Histogramme
  3. Diagramme en tige-et-feuilles
  4. Diagramme et boîte-et-moustaches
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nomme les forces et faiblesses de la représentation graphique

Distribution des fréquences

A

Force: Permet de visualiser rapidement la distribution de l’ensembles des données
Faiblesse: Difficile à lire si grand nb de scores et variation des fréquences adjacentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nomme les forces et faiblesses de la représentation graphique

Histogramme

A

Force: Simplifie la figure tout en préservant les tendances importantes
Faiblesse: Ne permet pas de voir les données individuelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Nomme les forces et faiblesses de la représentation graphique

Diagramme en Tige-et-feuilles

A

Force: Permet de visualiser à la fois la forme et les valeurs individuelles
Faiblesse: Aucune nommée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Nomme les forces et faiblesses de la représentation graphique

Diagramme en Boîte-et-moustaches

A

Force: Permet d’identifier la symétrie de la distribution et permet d’identifier les données extrêmes
Faiblesse: La forme n’est pas facilement visible et ne présente pas les valeurs individuelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

V/F Il est important d’utiliser plusieurs méthodes graphiques

A

Vrai, cela permet une meilleure représentation de la distribution de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les 2 cactéristiques qui différencient les distributions?

A
  1. Symétrie
  2. Voussure (concentration des scores)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les 4 degrés de symétrie?

A
  1. Normale (^)
  2. Bimodale (^^)
  3. Asymétrie NEG(-^)
  4. Asymétrie POS (^-)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les 3 degrés de voussure?

A
  1. Leptokutique (haut mince): peu de variabilité
  2. Mésokurtique (normale): scores centrés et quelques extrêmes
  3. Platikurtique (bas large): données étendues
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Notation

Que siginifie une lettre minuscule (Y) vs une lettre minuscule (y)?

A

Majuscule: Variable
Minuscule: Donnée de la variable

Ex: G=[5, 7, 8, 9]
g1= 5 et g3=8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Notation

V/F Lorsqu’il y a plus d’une variable, on précise la donnée avec plusieurs indices.

A

Vrai, ex: xij

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Notation

Que signifie Σ?

A

Sommation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment se lit:

9
ΣXi
i=3

A

La somme de tous les Xi pour les valeurs de i allant de 3 jusqu’à 9.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Propriété de la sommation?

(ΣX)^2=ΣX^2 ?

A

NON

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Propriété de la sommation

ΣXY = ΣX·ΣY ?

A

NON

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les 3 propriétés de la sommation?

A
  1. Σc=nC (la sommation de constante = n fois la constante)
  2. ΣcX=cΣX (la sommation d’une constante multipliée par une variable = constante multipliée par la sommation de la variable)
  3. Σ(x+y)=Σx + Σy (la sommation d’une somme de plusieurs quantités = la somme des sommations)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Tendance centrale

Définit ce qu’est une mesure de tendance centrale

A

Mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quels sont les 3 types de mesure de tendance centrale

A

Mode, médianne et moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Définit le mode

A

Résultat le plus fréquent

C’est LA réponse la plus populaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Comment nomme-t-on une ditribution à un mode? À deux modes?

A

Unimodale et bimodale

22
Q

V/F Lorsque deux modes sont adjacents, la distribution est bimodale.

A

FAUX, la ditribution est unimodale

Il faudra alors faire la moyenne des 2 valeurs

23
Q

Définit la médianne

A

Le point sur l’échelle des données ordonnées numériquement au-dessous duquel se situent 50% des cas

50e percentil d’une distribution

24
Q

Quels sont les calculs de la médianne?

A
  1. Localiser la POSITION de la valeur: (n+1)/2
  2. Noter la valeur (attention, si n est pair, la médianne est ;a moyenne des 2 données centrales)
25
Quelles sont les 2 propriétés de la médianne?
1. Elle n'est PAS affecté par les données extrêmes 2. La somme des distances en valeur absoule entre chaque score et la médianne est toujours plus petite ou égale à la somme des distances en valeur absolue entre chaque score et tout autre score (EXCLUANT la médiane)
26
Définit la moyenne
La somme des données d'une distribution pondérée par le nb de données
27
Quelles sont les 5 propriétés de la moyenne?
1. La somme de toutes les données est égale au nb de données multiplié par la moyenne 2. La somme des distances entre chaque score et la moyenne est égale à 0. 3. Addition/soustraction d'une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante 4. Multiplication/division d'une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante 5. Moyenne est affectée par les données extrêmes, contrairement à médiane ou mode.
28
Nomme avantages du mode
1. S'applique à des données nominales 2. Représente le plus grand nb de données 3. Non influencé par données extrêmes
29
Nomme avantages de la médiane
1. Non influencée par données extrêmes
30
Nomme avantages de la moyenne
1. Manipulations algébriques possibles 2. Estimateur plus stable de la tendance centrale lorsqu’on prélève plusieurs échantillons dans une population
31
Nomme désavantages du mode
* Souvent peu représentatif de la distribution * Se prête difficilement aux manipulations algébriques
32
Nomme désavantages médiane
Se prête difficilement aux manipulations algébriques
33
Nomme désavantages de la moyenne
Biaisée par les scores extrêmes
34
Quelles sont les 3 indices de dispersions?
1. Étendue 2. Variance 3. Écart-type
35
Définit ce qu'est un indice de dispersion
Degré de déviation des données individulles par rapport à la tendance centrale
36
Définit l'étendu et nomme sa formule
Distance entre donnée plus élevée et donnée la moins élevée d'une distribution | Étendue= Xmax-Xmin
37
Quelles sont les propriétés de l'étendue?
1. Ignore presque toute la distribution 2. Calculée à partir des données extrêmes (peut déformer) 3. Utilise avec une distribution naturellemnt bornée, comme l'âge
38
Qu'est-ce que l'écart-moyen?
Moyenne des écarts à la moyenne | Inutile CAR TJRS ÉGAL À 0
39
Quelle est le défaut de l'écart-moyen? Quelle est la solution pour y remédier?
Est inutile car est tjrs égal à 0. SOlution: Écart-moyen ABSOLU
40
Qu'est-ce que l'écart-moyen absolu? Quel est son défaut?
Moyenne des écarts en valeur absolue entre chaque donnée et la moyenne. Difficilement manipulable algébriquement.
41
Qu'est-ce que la variance?
Moyenne des carrés des écarts à la moyenne
42
Quelle est la différence entre la formule de la variance d'une population et d'un échantillon?
Population: divisé par N Échantillon: divisé par n-1 (corriger biais créé par estimation faite avec des petits nbs)
43
Qu'est-ce qu'est l'écart-type?
Racine carrée de la variance
44
Quelle est la différence entre la formule de l'écart-type d'une population et d'un échantillon?
Population: divisé par N Échantillon: divisé par n-1 (corriger biais créé par estimation faite avec des petits nbs)
45
# Complète l'affrimation Lorsqu'une distribution est normale et symétrique, ____________ des données se situent à +/- un écart-type de la moyenne et ____________ des données se situent à +/- 2 écart-type de la moyenne.
1. 1/3 2. 95%
46
Quelles sont les 3 propriétés de la variance et écart-type?
1. Très affectés par données extrêmes 2. Addition d'une constante à chaque donnée de la distribution NE modifie PAS la variance/écart-type. 3. La multiplication d’une constante à chaque donnée de la distribution produit une **nouvelle variance égale à la variance originale multipliée par cette constante au carré** et** un nouvel écart-type égal à l’écart-type original multiplié par cette constante.**
47
Qu'est-ce que le coefficient de variation?
Indice de dispesion qui permet de comparer écarts-types qui proviennent d'échantillons dont les moyennes ou les échalles de mesure diffèrent.
48
V/F La variance de la population et de l'échantillon sont tjrs égales.
Faux, à cause du N et n-1
49
VRAI OU FAUX ? Un diagramme en tige-et-feuilles permet de visualiser les données individuelles d’une distribution, mais il ne permet pas de visualiser la forme de la distribution
Faux, permet de visualiser la forme.
50
Le/la/l’ ________________ permet de visualiser rapidement toutes les données d’un ensemble à l’aide de barres verticales, tandis que le/la/l’ ____________________ permet de simplifier la représentation des données en les regroupant en intervalles.
1. Distribution de fréquence 2. Histogramme
51
Quels indices de tendance centrale sont égaux lorsque la distribution est symétrique ?
Médiane et moyenne | PAS mode, car distribution peut être symétrique et bimodale