Cours 2 Flashcards

1
Q

Mesures de dispersion:

A

• L’étendue
• L’étendue interquartile
• La variance
• L’écart type
• Coefficient de variabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

L’étendue

A

• La différence entre la valeur minimale et la valeur maximale d’une distribution;
• Score minimum: 10 000;
• Score maximum:200 000;
• Étendue: 200 000 – 10 000 = 190 000;

Avantage:
• Facile à calculer;
• Peut-être évalué par inspection visuelle;

Critique:
• Grossière;
• N’utilise que 2 données de la distribution!
• La distribution peut être différente même si l’étendue est similaire;
• Très influencée par les scores extrêmes;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

L’Étendue interquartile:

A

Les quartiles: 3 valeurs qui divisent les données triées en 4 parts égales;
• Situe 25 % des données (inférieures)
• La médiane (50%) de la série
• Situe 25 % des données (supérieure)
• Inclus 50% des observations;
• Moins influencée par les scores extrêmes;
On enlève les 25% supérieurs et inférieures et on garde le milieu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

La variance:

A

L’erreur autour de la moyenne:
La moyenne est un bon estimateur lorsque l’erreur est petite;
• Erreur: écart entre chaque observation et la moyenne;
• Déviance;

  • Lorsque les observations sont davantage différentes, Mx devient moins précise pour l’estimation de la distribution;
  • La statistique pour estimer le degré de différence entre les observations se nomme la variance
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

La déviance

A

1re étape: calculer les écarts à la moyenne (déviance);
• Pour chaque valeur on calcule l’écart qui le séparede sa moyenne arithmétique;
• Calculer la somme?
• Déviance totale = ?
La déviance sera toujours zero quand on utilise la moyenne de déviance
Somme des différences au carré

2e étape:
• La somme des différences au carré (« sum of squared errors ») ou « SS » vient pallier ce problème.
• Mettre les écarts au carré
• Calculer la somme
• −402, −302, −202, −102, 02, 52, 102, 202, 302, 352
2e étape:
• Mettre les écarts au carré
3e étape: Somme des carrés des écarts à la moyenne
• 1600 + 900 + 400 + 100 + 0 + 25 + 100 + 400 +
900 + 1225 = 5650

• Augmenter de manière exponentielle au fur et à mesure que n augmente;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

L’écart type:

A

Variance: la différence moyenne au carré;
Écart type: la différence moyenne;

Les étudiants du groupe 1 ont en moyenne 60 à l’examen intra, avec une différence moyenne de plus ou moins 25,05;
• L’écart-type indique la différence moyenne entre les valeurs d’une distribution et sa moyenne;
• L’écart-type est conceptuellement identique à la variance, mais c’est une statistique plus simple et plus facile à interpréter;
• Une variance plus grande produira un écart-type plus grand;

• Voici les deux groupes :
• Pourquoi est-ce que les résultats de l’examen du groupe 2 démontrent une faible variance ?
• Parce que la mesure elle-même ne permet pas beaucoup de différenciation / discrimination;
Parce que les répondants sont très similaires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Variance:

A

• Plus il y a d‘observations loin de la moyenne, plus la variance sera élevée; Plus les observations se concentrent autour de Χ, moins grande sera la variance.
• L’ajout d’observations proches de moyenne aura tendance à réduire la variance;
• L’ajout d’observations loin de la moyenne aura tendance à faire augmenter la variance;
• La variance est stable lorsque la distribution est composée de 30 observations et plus;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Coefficient de variabilité:

A

Coefficient de variabilité
• Permets la comparaison du niveau de variabilité des variables qui n’ont pas la même moyenne et variance numérique.
• La variable ayant le CV le plus grand: plus de différences individuelles entre les observations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Le positionnement relatif d’une observation

A

Positionnement:
• Il est possible de décrire / interpréter une observation à partir de sa position relative face aux autres observations de la distribution.
• Différences individuelles;
• Faciliter l’interprétation;

Façons de positionner les gens:
• Le rang absolu : positionne chaque observation dans une échelle ordinale.
• Le percentile : positionne chaque observation relativement aux autres.
• La valeur étalon : positionne chaque observation relativement à la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Le rang absolu

A

• Transformation de scores bruts ordonnés en nombres représentant leur position (rang), du plus petit au plus grand (ou l’inverse);

Procédure:
• Comptez le nombre total d’observations (n);
• Triez les observations en ordre de grandeur (1 à n);
• Assignez le rang « 1 » à la valeur la plus forte (ou la plus faible) et le rang n à la valeur la plus faible (ou la plus forte);
• Lorsque deux observations sont identiques, assignez le rang moyen aux deux;

Avantage:
• Facile à comprendre et à calculer

Désavantages:
• Le rang absolu étant une mesure ordinale, on perd certaines informations:
• La différence entre l’observation qui occupe le rang 3 et celle qui occupe le rang 4 pourrait être grande ou petite;
• Peut être interprété seulement si nous connaissons la taille de la distribution;

L’utilisation du rang absolu:

Le rang absolu est très utile lorsqu’il faut faire un choix:
• Lors de l’admission, on choisit la meilleure université;
• En organisation, pour la sélection des employés: il faut choisir les trois meilleurs employés;
• L’admission aux programmes d’études contingentés (on ne peut accepter que les 10 meilleurs étudiants).
Le rang absolu est facile à interpréter:
• Ex.: L’UdeM obtient la 81e place mondiale au classement Impact du «Times Higher Education» (n=2112)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Percentile:

A

Le percentile positionne chaque observation relative à la proportion des observations égales ou inférieures;

Ex: Paul obtient 70% à un examen et il se situe à 50e percentile: 50% des étudiants ont obtenu une note égale ou inférieure à Paul.
• Ses valeurs vont de 1 à 100
• Certains percentiles ont des noms particuliers:
• Quartiles (C 25 , C 50 et C 75 )
• Quintile (C 20 , C 40 , C 60 et C 80 )
• Déciles (C 10 , C 20 , C 30 … C 90 )

• Convertir chaque valeur en pourcentage (proportion);

Utilisation du percentile:
• Lorsque nous voulons comparer un score à une norme (poids, taille, etc. )
• Dans le cadre d’un test standardisé (intelligence, etc.).
• Pour expliquer en termes simples:
• La taille de cet enfant le situe au 20e percentile des enfants de son âge. Il est petit, car seulement 20 % des enfants sont de taille égale ou inférieure à lui (et 80 % sont plus grands).
• Pour établir des catégories discrètes à partir d’une distribution continue:

Exemple: Assignation des lettres pour une distribution de notes à l’examen. Les 5% meilleurs obtiennent un A, les prochains 10% obtiennent un B, etc.).

• Est-ce que B gagne deux fois plus que A?
• Utilise seulement la fréquence et non la valeur en soi!

• Les percentiles sont moins adaptés aux petits nombre d’observations (la proportion de chaque fréquence sera automatiquement plus élevée et l’asymétrie est possiblement plus grande). Ex.: 4/10 = 40 %; 4 / 1000 = 0,4 %.

Avantage:
• Facile à calculer,
• Facile à comprendre,
• Fournis plus de détails que le rang simple

Désavantage
Utilisation préférablement réservée aux grands nombres d’observations; Sensible aux déviations à la normalité;
Utilise uniquement les fréquences des effectifs, pas la distance absolue entre les valeurs;

Percentiles: distribution divisée en 100 parties égales.
Médiane = 50e percentile;

Quartiles: quatre parties égales;
Médiane = 2e quartile;

Déciles: dix parties égales;
Médiane = 5e Déciles;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

La valeur étalon (Z ou T)

A

positionne chaque observation par rapport à l’ensemble des autres observations;

• La valeur étalon situe l’observation par rapport au meilleur estimée de toutes les valeurs de la distribution…
• Prends en considération la variabilité des observations, ce que le percentile ne fait pas.

On établit la position de l’observation x en calculant
son écart à la moyenne: 𝑥 = 𝑋𝑋 − 𝑀

• Le signe indique si l’observation est au-dessus ou en dessous de M;
• La taille de l’écart indique si l’observation est proche ou loin de M;
Donc, l’écart indique la position (+,-) aussi bien que la distance entre n’importe quelle observation et la moyenne.

Comparer une personne sur deux variables:
Marie a obtenu 60 % en chimie et 80 % en français. Est-elle meilleure en français qu’en chimie?
Écart à la moyennes = 0

Valeur étalon z (score z)
𝑧𝑖𝑖 = la valeur étalon de l’observation x
𝑥𝑖𝑖 = la valeur de l’observation sur l’échelle de mesure
𝑀𝑥= la moyenne de la mesure
𝑆𝑥 =l’écart type de la mesure.

• Ainsi, avec le score z, nous exprimons chaque différence par rapport à l’écart type de la distribution de laquelle provient l’observation
• Le même écart à la moyenne peut prendre un sens différent, en fonction du degré de variabilité de la distribution.

• Un z positif indique que l’observation est supérieure à la moyenne.
• Un z négatif indique que l’observation est en dessous de la moyenne.
• Plus le z est grand, plus grand est l’écart entre l’observation et la moyenne de la variable.
• Ainsi, avec le score z, nous exprimons chaque différence par rapport à l’écart type de la distribution de laquelle provient l’observation
• Plus le score z est grand, plus la différence entre la moyenne et l’observation est grande. (En principe, >3 est très rare)

Important : lorsque toutes les observations de la distribution sont exprimées en z
La moyenne des valeurs z = 0.
La variance (et l’écart type) =1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

La comparaison directe des performances sur deux variables exige que celles-ci…

A

aient la même moyenne et la même variance;

• C’est impossible dans la plupart du temps !
• Convertir toutes les observations de chaque variable en valeurs étalons (scores z) fera que les variables auront toute la même moyenne et la même variance.
La distribution, qu’elle soit normale ou asymétrique, doit toutefois être unimodale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Valeur étalon T (score-T)

A

Valeurs T
Autre forme de la valeur étalon, identique conceptuellement au z, mais…
La moyenne des valeurs T = 50. L’écart-type = 10
Calcule 𝑇 = 10𝑧 + 50

Forte utilisation en psychométrie
une performance « moyenne » , qui correspond à z = 0 et T = 50.
Pour une personne qui ne connait pas les statistiques, z = 0 ressemble à un score nul (mauvais score), tandis que T= 50 ressemble davantage à une performance «moyenne».

How well did you know this?
1
Not at all
2
3
4
5
Perfectly