stat Flashcards

1
Q

Quels sont les types de variables ?

A
  • Nominales : Catégories sans ordre (ex. couleur des yeux).
  • Ordinales : Catégories ordonnées (ex. échelle de satisfaction).
  • Quantitatives : Variables numériques (ex. âge, taille).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelle est la différence entre une variable nominale et ordinale ?

A

Une variable nominale n’a pas d’ordre (ex. nationalité), alors qu’une variable ordinale peut être classée (ex. échelle de satisfaction).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pourquoi utilise-t-on des statistiques en psychologie ?

A

Pour analyser des données, modéliser des phénomènes et valider des hypothèses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la différence entre moyenne et médiane ?

A

La moyenne est influencée par les valeurs extrêmes, tandis que la médiane ne l’est pas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que l’étendue ?

A

C’est la différence entre la valeur maximale et la valeur minimale d’un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment calcule-t-on l’étendue ?

A

Etendue=Max−Min

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que l’intervalle interquartile (IQR) ?

A

C’est la différence entre le 3ᵉ quartile (Q3) et le 1ᵉʳ quartile (Q1), représentant l’étalement des 50 % centraux des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la formule de l’intervalle interquartile ?

A

𝐼𝑄𝑅=𝑄3−𝑄1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que l’écart-type ?

A

C’est une mesure de dispersion qui indique à quel point les valeurs s’éloignent de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi faut-il faire attention aux statistiques ?

A

Parce qu’elles peuvent être mal interprétées, biaisées ou utilisées de manière trompeuse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la principale erreur dans l’analyse des pourcentages ?

A

Ne pas préciser sur quelle population le pourcentage est calculé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la différence entre un tableau de protocole et un tableau d’effectifs ?

A

Le tableau de protocole contient toutes les données brutes, tandis que le tableau d’effectifs regroupe et synthétise les valeurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Pourquoi ne considère-t-on pas un identifiant comme une variable ?

A

Parce qu’il ne varie pas en fonction d’un phénomène étudié, il sert juste à identifier les individus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel type de variable est une note sur 20 ?

A

C’est une variable quantitative discrète.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pourquoi une question à choix multiple peut-elle poser un problème statistique ?

A

Parce qu’une personne peut sélectionner plusieurs réponses, ce qui complique l’analyse des fréquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Si 30 % des étudiants d’une promo sont en difficulté et qu’il y a 200 étudiants, combien sont en difficulté ?

A

200×0.30=60
Donc 60 étudiants sont en difficulté.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelle est la principale erreur dans l’interprétation d’un pourcentage ?

A

Confondre “X % de A sont B” et “X % de B sont A”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Pourquoi faut-il toujours donner la population de référence dans un pourcentage ?

A

Car un même pourcentage peut être très différent selon la taille du groupe étudié.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Pourquoi l’écart-type est souvent préféré à la variance ?

A

Parce qu’il est exprimé dans la même unité que les données, ce qui facilite son interprétation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Que signifie un écart-type élevé ?

A

Que les données sont très dispersées autour de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Si la médiane d’un ensemble de données est plus basse que la moyenne, que peut-on en conclure ?

A

Que la distribution est asymétrique vers la droite (présence de valeurs élevées qui tirent la moyenne vers le haut).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelle est l’utilité de l’intervalle interquartile ?

A

Il mesure la dispersion des 50 % centraux des données et est moins sensible aux valeurs extrêmes que l’écart-type.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Que signifie une étendue très grande mais un IQR faible ?

A

Qu’il y a quelques valeurs extrêmes, mais que la majorité des données est concentrée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quelle est la différence entre un pourcentage en ligne et un pourcentage en colonne ?

A

Le % ligne est calculé sur chaque ligne (comparaison au sein d’un même groupe)
le % colonne sur chaque colonne (comparaison entre plusieurs groupes).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Pourquoi faut-il faire attention aux pourcentages dans un tableau croisé ?
Parce qu’un même % peut être trompeur selon s’il est calculé sur les lignes, les colonnes ou le total.
26
Que signifie "biais de confirmation" en statistiques ?
C’est la tendance à interpréter les données de manière à confirmer ses croyances préexistantes.
27
Pourquoi ne peut-on pas dire "statistiquement prouvé" ?
Parce que les statistiques montrent des tendances, mais ne prouvent jamais une causalité absolue.
28
Pourquoi faut-il être prudent avec les données récentes en statistiques ?
Parce qu’elles peuvent être incomplètes, biaisées ou non reproductibles.
29
C’est quoi un pourcentage ?
Une fraction, c’est-à-dire une partie d’un groupe, Le nombre d’unités ciblées divisé par le total, Une valeur qu’on exprime sur 100 pour que ce soit plus facile à comprendre. Exemple : Si 480 étudiants sur 600 sont des femmes → 480 ÷ 600 = 0,80 = 80 %
30
Quelles sont les 3 infos indispensables pour bien comprendre un pourcentage ?
1- la population de référence (où, le contexte) 2- la part (la fraction, le pourcentage) 3- le sous-groupe décrit (qui, quoi) Exemple : ➡️ Il y a 25 % de femmes dans ce groupe → 1. Groupe = population de référence → 2. 25 % = part → 3. Femmes = sous-groupe décrit
31
C’est quoi une variable ?
une propriété commune à l'ensemble des individus d'une étude La valeur de cette propriété varie selon les individus
32
Variables ordinales
→ On peut classer les individus en « plus » et « moins » → Les distances entre les valeurs n’ont pas de sens → les valeurs sont souvent numériques dans les données
33
Règles avec les variables ordinales en psychologie
1/ si 4 modalités ou moins : nominale 2/ si 5 modalités ou plus : quantitatives en mettant des notes « 1 », « 2 », …
34
Pourquoi un pourcentage peut-il être une fréquence ?
Un pourcentage est une fraction d’un ensemble. 10 % = 10/100 = 0,10 (fréquence en valeur décimale). 💡 Astuce : Toujours convertir en fraction ou en décimal pour éviter les erreurs d’interprétation.
35
Mode
la valeur de la variable ayant l’effectif le plus important Indicateur intéressant pour une variable qualitative ou quantitative Mais attention si on travaille sur un tableau de protocole
36
Moyenne
La somme des valeurs divisée par le nombre total (l’effectif) Elle ne s’utilise pas pour une variable qualitative/nominale C’est l’indicateur le plus courant pour les variables quantitatives ⚠️ Attention : elle peut être trompeuse si des valeurs extrêmes faussent le résultat 📌 Exemple : Si une personne gagne 100 000 € dans un groupe où les autres gagnent 1 200 €, la moyenne ne représente plus vraiment "la norme" du groupe.
37
Médiane
👉 Valeur qui coupe les données en deux parts égales. ✅ Moins sensible aux extrêmes. 🧠 Intuitive et utile quand peu de données. ⚠️ Plus longue à calculer que la moyenne.
38
Indicateurs de positions
👉 C’est une valeur qui résume l’ensemble des données. 🎯 Il montre où se situe "en gros" la tendance des valeurs. 🔹 Il peut être : La moyenne (valeur moyenne), La médiane (valeur du milieu), Le mode (valeur la plus fréquente). ✅ On choisit l’indicateur selon le type de données et le contexte.
39
Moyenne d'une médiane
Somme de toutes les valeurs divisée par leur nombre, elle représente une valeur "équilibrée".
40
Quelle est la différence entre une variable qualitative et quantitative ?
Qualitative : Catégories (ex : couleur des yeux). Quantitative : Valeurs numériques (ex : âge, taille).
41
Donner un exemple d’erreur d’interprétation d’une moyenne.
Dire que le salaire moyen est de 2500€ ne signifie pas que la majorité des gens gagnent 2500€ (la médiane pourrait être bien plus basse).
42
Quelles sont les deux sous-catégories des variables quantitatives ?
Discrète : Valeurs entières (ex : nombre d'enfants). Continue : Toute valeur dans un intervalle (ex : taille en cm).
43
Que sont les mesures de tendance centrale ?
Moyenne, médiane et mode.
44
Quelles sont les principales mesures de dispersion ?
Étendue, variance, écart-type et intervalle interquartile.
45
Comment calcule-t-on l’écart-type ?
Racine carrée de la variance.
46
Quelle est la différence entre un échantillon et une population ?
Population : Ensemble complet des individus. Échantillon : Sous-ensemble représentatif de la population.
47
Qu’est-ce qu’une estimation ponctuelle ?
Une valeur unique utilisée pour estimer un paramètre inconnu de la population.
48
Qu'est-ce qu'un intervalle de confiance ?
Une plage de valeurs qui a une forte probabilité de contenir le vrai paramètre de la population.
49
Quelle est la différence entre une hypothèse nulle et une hypothèse alternative ?
Hypothèse nulle (H0) : Pas d’effet ou de différence. Hypothèse alternative (H1) : Existence d’un effet ou d’une différence.
50
Que représente le seuil de signification (alpha) ?
Probabilité maximale d’accepter à tort l’hypothèse alternative (souvent 5 % ou 0,05).
51
Que signifie une valeur p inférieure à 0,05 ?
Il y a moins de 5 % de chances que l'effet observé soit dû au hasard, donc on rejette H0.
52
Quels sont les principaux types d’échantillonnage ?
Aléatoire simple : Chaque individu a une probabilité égale d’être choisi. Stratifié : On divise la population en groupes homogènes et on tire un échantillon dans chaque groupe. Systématique : On sélectionne un individu à intervalle régulier (ex : 1 individu sur 10). Par grappes (ou en grappe) : On divise la population en groupes et on sélectionne aléatoirement certains groupes entiers.
53
Quelle est la différence entre un échantillonnage probabiliste et non probabiliste ?
Probabiliste : Chaque individu a une chance connue d’être sélectionné (ex : aléatoire simple). Non probabiliste : La sélection repose sur des critères non aléatoires (ex : échantillon de convenance).
54
Quels sont les principaux types de graphiques utilisés en statistiques ?
Histogramme : Pour représenter des données quantitatives continues. Diagramme en barres : Pour des variables qualitatives ou quantitatives discrètes. Boîte à moustaches : Pour visualiser la distribution et détecter les valeurs extrêmes. Nuage de points : Pour observer la relation entre deux variables quantitatives. Camembert (ou diagramme circulaire) : Pour représenter des proportions.
55
Qu’exprime la loi des grands nombres ?
Plus un échantillon est grand, plus la moyenne observée se rapproche de la moyenne réelle de la population.
56
Quelle est la différence entre corrélation et causalité ?
Corrélation : Deux variables évoluent ensemble, mais sans relation de cause à effet prouvée. Causalité : Une variable influence directement une autre.
57
À quoi sert une régression linéaire ?
À modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes.
58
J’ai 600 étudiants en L1 Psycho, dont 480 femmes. Quel est le pourcentage de femmes ?
480/600=0,80, donc 80 % de femmes.
59
En L1 Psycho, 80 % sont des femmes. Combien cela fait-il sur 600 étudiants ?
600×0,80=480 → 480 femmes.
60
Dans un test d’émotion, 400 psychologues ont réussi, 200 ont échoué ; 20 mathématiciens ont réussi, 80 ont échoué. Qui réussit le plus en proportion ?
Psychologie : 400/600 = 67% de réussite Mathématiques : 20/100=20% de réussite → Les étudiants en psycho réussissent plus.
61
Parmi les 420 réussites au test, 400 viennent de psycho, 20 de maths. Quelle est la part de psycho parmi les réussites ?
400/420=95% → 95 % des réussites viennent de psycho.
62
Niveau de vie en France (2018) : médiane = 1770 €, moyenne = 2054 €. Quelle conclusion ?
La moyenne est tirée vers le haut par les revenus extrêmes. → La majorité gagne moins que la moyenne.
63
Quelle est la différence entre "25 % de femmes dans ce groupe" et "25 % des femmes sont dans ce groupe" ?
"25 % de femmes dans ce groupe" → Référentiel = le groupe → 25 % du groupe est composé de femmes. "25 % des femmes sont dans ce groupe" → Référentiel = les femmes → 25 % de toutes les femmes appartiennent à ce groupe. ⚠ Toujours identifier le référentiel avant d’interpréter un pourcentage !
64
Les actes antisémites passent de 311 (2017) à 541 (2018). Le ministre parle de +74 %. Juste ?
Oui, car (541−311)/311=0,74. → Mais cela peut donner une impression exagérée de "crise" sans contexte.
65
Il y a 20 % d’hommes en psycho. Est-ce la même chose que 20 % des hommes sont en psycho ?
Non. 1ère : Dans la filière psycho, 20 % sont des hommes. 2ème : Parmi tous les hommes, 20 % font de la psycho. → Toujours identifier la population de référence !
66
90 % des 20 % ayant fait une impasse regrettent. Combien de personnes regrettent ?
0,90×0,20=0,18, donc 18 % de tous les individus ont regretté.
67
Dans une enquête, 60 % des femmes et 40 % des hommes ont répondu "oui". Peut-on dire que les femmes sont majoritaires à avoir dit "oui" ?
Non, car il faut aussi connaître la répartition femmes/hommes dans l’échantillon total.
68
En Floride, 3,19 % des meurtriers blancs sont condamnés à mort contre 2,35 % de noirs. Cela semble plus sévère pour les blancs ?
Faux ! Une analyse par origine de la victime montre l’inverse : Si la victime est blanche, les noirs sont bien plus condamnés que les blancs. → Exemple typique d’un paradoxe statistique (Simpson).
69
Si 70 % des élèves ont réussi un examen et que 40 % des filles ont échoué, peut-on conclure que les garçons réussissent mieux ?
Non, car on ne connaît pas la proportion filles/garçons dans la classe.
70
Si dans un groupe les notes vont de 3 à 18, quelle est l’étendue ?
18−3=15 → Plus l’étendue est grande, plus la dispersion des données est importante.