cours 6 Flashcards

(74 cards)

1
Q

Rappel: Comment peut-on réduire l’incertitude relative?

A

Cela diminue l’incertitude parce que, si tu sais qu’il y a une relation solide entre deux variables, tu peux prédire l’une en fonction de l’autre de manière plus fiable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Finis la phrase: La psychologie est l’étude des…

A

différences individuelles (on s’intéresse a la compréhension des individus)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

C’est quoi la mise en pratique de la réduction de l’incertitude?

A

Avec la régression, tu prends la position d’une personne sur l’axe X et tu utilises cette info pour prédire sa position probable sur l’axe Y. C’est un peu comme deviner l’avenir en te basant sur des patterns passés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Le degré de précision de cette estimation dépend de quoi ?

A

De la taille de la r xy connue (si la corrélation est forte le degré de précision de la prédiction sera forte aussi)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

La meilleure estimé statistique est la moyenne, alors c’est quoi l’idée de la regression?

A

Essayer d’améliorer la prédiction qui est faite par la moyenne (comprendre ce qui fait x permet d’avoir une prédiction plus raffiné)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi est ce que utilisé la moyenne comme base de prédiction en psychologie peut être un problème?

A

1- Certes la moyenne est le meilleur estimé de chaque valeur d’une distribution en l’absence de d’autres informations
2- Cependant, chaque distribution n’a qu’une seule moyenne, donc on prédit la même valeur pour toutes les observations d’une distribution
3- En psycho, on s’intéresse aux différences individuelles donc une estimation basée sur la moyenne est moins précise et moins utile

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Est ce que la corrélation permet de prédire précisément pour un individu?

A

La corrélation montre s’il y a une relation entre deux variables et à quel point elles sont liées, mais elle ne permet pas de prédire précisément pour un individu. Si on sait que l’observation x est plus grande que la moyenne de x, on peut prédire que l’observation y sera supérieur à la moyenne de y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce qui permet de prédire précisément pour un individu?

A

La régression utilise la relation générale (fournit par la corrélation) pour faire des prédictions plus personnalisées, en estimant la valeur d’une variable pour une personne donnée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

En gros, explique moi comment la corrélation et la régression travail ensemble pour faire des prédictions individuelles.

A

En gros, la corrélation te donne une idée générale, et la régression t’aide à faire des prédictions plus exactes pour chaque observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Explique moi chaque mot dans “Régression Linéaire Simple”

A

Régression: C’est le nom de l’action de prédire/ estimer la VD (y) à partir de sa position connue sur VI (x)
Linéaire: Car la régression linéaire est basée sur la corrélation et celle ci postule des liens linéaires entre x et y
Simple: Car on utilise seulement une VI pour prédire VD (vs régression linéaire multiple)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pourquoi on dit que le lien est linéaire entre X et Y?

A

ça veut dire qu’on suppose que la relation entre les deux variables est droite, sans courbe ni changement de direction. Si X augmente, Y augmente de manière constante, suivant une direction droite.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment peut-on améliorer la précision de la prédiction.

A

Vu que la précision de la prédiction se base directement sur la corrélation, plus la corrélation augmente, plus la précision de la prédiction s’améliore

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

C’est quoi la prédiction pour une corrélation positive?

A

une valeur élevée en x est associée à une valeur élevé en y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

C’est quoi la prédiction pour une corrélation de zéro?

A

Peut importe la position de x, il y’aura pas de position associée à y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

C’est quoi la prédiction pour une corrélation négative?

A

Un score élevée en x est associée à un score faible sur y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est ce que je fait quand ma corrélation est de zéro pour prédire y.

A

j’utilise la moyenne sur y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

C’est quoi les deux types de régression linéaire simple?

A

1- Régression linéaire simple standardisé (score z)
2- Régression linéaire simple non standardisé (unités réelles)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

C’est quoi la droite de régression (concept central)?

A

La tendance des coordonnées xy est représentée à l’aide d’une droite de régression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

C’est quoi la différence entre les droites de régressions quand la corrélation est parfaite vs pas complètement parfaite (erreur de prédiction)?

A

Chaque valeur x est associé a une seule valeur y quand la corrélation est parfaite (tous les points sont sur la droite)
Quand la corrélation n’est pas parfaite, soit pas tous les points touchent la droite ou y’a plusieurs y possible par x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Comment on place correctement la droite de régression dans l’approche graphique?

A

Elle est placée au centre (à la moyenne) du nuage de point pour qu’elle représente mieux la distribution des coordonnées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Comment appel-t-on l’axe des x et l’axe des y?

A

Axe des x: abscisse
Axe des y: ordonnée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

C’est quoi l’ordonnée à l’origine?

A

C’est les valeurs de y quand x est égale à 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

C’est quoi la pente? C’est quoi le lien entre la pente et la corrélation?

A

combien Y augmente ou diminue quand X augmente de 1
- Pente moins élevée= Corrélation moins forte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

La droite de régression doit toujours passer par quel point?

A

L’ordonnée à l’origine (0,0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
C'est quoi le principe qui permet de nous guider quand on veut placer la droite de régression dans l'approche graphique?
La somme des écarts à la moyenne est toujours égale à 0 (on positionne les coordonnés puis on calcule les écarts et on s'assure que la somme des écarts est égale à 0)
26
Comment je peux savoir si la droite est à la bonne place dans l'approche graphique?
Lorsque la somme des écarts est égale à zéro ( je fait autant de surestimation que de sous estimation ce qui donne zéro erreurs au final)
27
En pratique, ce qui est plus utilisé c'est l'approche graphique ou statistique?
approche statistique
28
On vient de voir la régression selon l'approche graphique, maintenant comment on positionne la droite selon l'approche statistique?
Formule: ŷ = r xy * zx Valeur prédite= corrélation multiplier par le score z de x
29
Pourquoi est ce qu'on dit que l'approche graphique est moins utilisé?
1- Facilement imprécis 2- Lent et Fastidieux 3- Pas généralisable aux formes de régressions plus complexe
30
En régression standardisé, on remplace le mot corrélation par quoi?
Coefficient bêta = Coefficient de régression standardisé
31
C'est quoi la différence entre le symbole de la corrélation quand on parle de corrélation et quand on parle de régression?
1- Corrélation= r xy 2- Régression= β
32
C'est quoi le but de la régression simple standardisé?
Estimer ou prédire la position probable en score z de y à partir de la position en score z de x
33
À quoi réfère z x? Quel nom prend-t-il?
score z connue (de la VI) Prend le nom de prédicteur
34
À quoi réfère ŷ ? Comment l'appel-t-on?
Au score z qu'on veut prédire (de la VD) On l'appel variable prédite ou résultante
35
Que signifie le terme bêta?
Que la régression est standardisé
36
À l'aide de toutes ces infos, donne moi la formule pour la régression standardisé selon l'approche statistique
ŷ = βx * Zx
37
C'est quoi le lien entre l'inférence statistique et la régression standardisée?
J'ai un échantillon et je trouve le coefficient bêta pour celui çi. Je peut inférer qu'il sera vrai pour d'autres personnes qui proviennent de la même population.
38
Quels sont les inconvénients de la régression simple standardisée?
Peut importe si on utilise l'approche graphique ou statistique, le problème c'est que elle produit un estimé de y en score z au lieu de produire un estimé en valeur de l'échelle originale ce qui est moins utile en pratique
39
Dans quel contexte la régression standardisée est plus utile?
La régression standardisée est surtout bonne pour comprendre si X et Y sont liés en général (sur le plan théorique), mais pas très pratique si tu veux une prédiction directement utilisable dans le monde réel.
40
C'est quoi une régression linéaire non standardisé?
La régression non standardisée (NS) analyse les données originales et produit un estimé en valeurs originales.
41
Comment on établit la droite de régression si les valeurs originales proviennent de distributions x et y qui n’ont pas nécessairement une moyenne et un s identique?
La droite de régression sera établie en intégrant les moyennes et s de x et de y
42
Est ce que la régression non standardisé doit aussi passée par les coordonnées (0,0)?
Non, pas nécessairement
43
Est ce que l'approche graphique de la régression non standardisée est pratique?
non, elle nous aide à comprendre la logique mais elle n'est pas pratique
44
Comment est produite la droite de régression dans l'approche graphique de la régression non standardisé?
Quand on construit une droite de régression, on utilise une procédure itérative qui ajuste progressivement le modèle. Σ+ = Σ- signifie que les erreurs positives et négatives doivent s’équilibrer
45
La droite de régression est définie par deux éléments dans l'approche statistique, lesquels?
1- L'ordonnée à l'origine (a) 2- La pente ou coefficient de régression (b)
46
C'est quoi la formule de la droite de régression dans la régression non standardisé?
y = a + b x
47
Que nous indique la variable "b" ?
Le rapport entre la variable x et la variable y (à chaque fois que x augmente de 1, y augmente de combien?)
48
C'est quoi la formule de b?
b = r xy (sy / sx)
49
Si la corrélation est nulle (r xy= 0) c'est quoi la valeur de b?
0 (si la corrélation est nulle, il n'y a pas de lien donc x ne te renseigne pas sur y)
50
Si l'écart type ou la variance est de zéro, c'est quoi la valeur de b?
0
51
La corrélation bêta varie entre combien et combien?
Comme la corrélation, bêta varie entre -1 et +1
52
C'est quoi les valeurs possibles de b?
Valeur minimale: 0 Valeur maximale: indéterminée
53
À quoi sert l'ordonnée à l'origine?
C'est une constante qui est ajoutée pour finaliser la prédiction en ajustant la valeur prédite pour qu'elle soit sur l'échelle de y (prend en considération que les deux variables x et y n'ont pas la même moyenne et peuvent être numériquement différente)
54
C'est quoi la formule de a?
a= moyenne sur y - coefficient b multiplié par la moyenne de x
55
En régression simple en général, la taille et le signe des coefficients a et b dépendent de quoi?
Moyennes de x et y Écart type de x et y Coefficient r xy de x et y
56
C'est quoi les similarités entre la régression standardisée et non standardisée
1- La droite de régression est basée sur la corrélation 2- Les deux s'établissent graphiquement de la même manière (ont pour but de diminuer l'erreur d'estimation)
57
C'est quoi les différences entre la régression standardisé et non standardisé?
1- L’ordonnée à l’origine est toujours « 0 » en régression standardisée, alors qu’elle n’est presque jamais « 0 » en non standardisée. 2- La régression standardisée utilise la corrélation (standardisée) pour produire un estimé en valeur standardisée. La régression NS utilise la relation non standardisée pour produire une estimation en valeurs originales.
58
Compare moi l'utilisation de b vs beta.
1- beta est utilisé quand on veut déterminer l'importance d'une VI pour la prédiction de VD alors que b est utilisé quand on veut prédire la valeur y exprimée sur la même échelle que x 2- beta est utilisé principalement dans un contexte théorique alors que b est utilisé principalement en pratique sur le terrain pour faire une vraie prédiction.
59
C'est quoi le point de coupure?
Dans mon processus d'embauche, je choisis un point sur x (exemple ils doivent etre capable de vendre au moins 15 voitures) et on regarde c'est quoi la valeur de y associé pour nous aider a faire notre choix
60
C'est quoi l'erreur d'estimation?
Écart typique entre le score prédit et le score réel lors d’une régression
61
Pourquoi l'erreur d'estimation est importante?
Car la régression a pour but de prédire une valeur inconnue qui servira a prendre une décision sur quelqu'un donc si on fait une erreur ça peut devenir potentiellement grave pour la personne.
62
C'est quoi le degré de précision de l'inférence?
Moyen d'estimer la taille de l'erreur d'estimation potentielle.
63
Quelle est la situation ou je fait un maximum d'erreur?
Quand bêta ou b est égale à 0 (pas de lien) donc j'utilise la moyenne comme estimé, donc l'erreur d'estimation est très grande (pas de régression)
64
Quelle est la situation ou je fait un nombre d'erreurs plus faible?
Lorsque la relation est forte (entre 0,5 et 1)
65
Quelle est la situation ou il n'y a pas d'erreur d'estimation?
quand la relation est parfaite (corrélation de corrélation = 1)
66
Comment on calcul l'erreur d'estimation pour une personne?
erreur d'estimation = valeur prédite de y - valeur réelle de y (e = (ŷ - y).
67
C'est quoi l'erreur moyenne d'estimation?
Si je prend une personne au hasard, c'est quoi l'erreur que je fait typiquement (je fait une échelle de confiance)
68
L'erreur moyenne d'estimation te fait penser a quelle autre mesure?
l'écart type l'erreur type à la moyenne
69
Comment on calcule concrètement l'erreur moyenne d'estimation (se) et quel problème peut-on rencontrer?
C'est comme pour l'écart type, on fait autant d'erreur positives que négatives donc si on les additionne tous ça fait 0. On va donc prendre les erreurs et les mettre au carré puis faire la racine carré
70
Vrai ou Faux. L'erreur d'estimation est donc l'écart type des erreurs.
Vrai
71
Comment peut on calculer l'intervalle de confiance?
On dit qu'il y a 68 % de chances parce que l'intervalle de confiance que nous avons calculé correspond à un intervalle de confiance à 1 écart-type autour de la prédiction. Ce concept provient de la distribution normale, qui est symétrique et souvent utilisée en statistique.
72
C'est quoi le lien entre se (erreur moyenne d'estimation) et béta ou b?
plus faible est le coefficient de corrélation lus fort sera l'erreur moyen d'estimation
73
C'est quoi le lien entre le se et l'intervalle de confiance?
Plus grande l'erreur moyenne d'estimation, plus grande sera la fourchette de valeurs autour de la valeur prédite (prédiction moins précise)
74
C'est quoi les postulats de la régression?
- Échelles à intervalles ou de rapport (ratio). - Variance sur x et sur y (homogénéité des variances). - Linéarité. - Distributions normales de x et de y. - Éviter les valeurs extrêmes (« outliers »).