Cours 4 Flashcards

(112 cards)

1
Q

C’est quoi le concept d’inférence statistique?

A

C’est un concept fondamental qui nous permet de tirer des conclusions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

C’est quoi les concepts abordées dans l’inférence statistiques

A

Population et échantillon
Échantillons aléatoire
Paramètres vs statistiques
Hypothèse nulle et hypothèse alternative
Erreur d’échantillonnage
Erreurs d’inférence alpha et bêta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

C’est quoi la différence entre la population et l’échantillon ?

A

La population constitue un groupe complet ou un groupe inaccessible que nous souhaitons connaître (on y a pas accès généralement pcq c trop gros)

L’échantillon consiste en ce que nous connaissons (de quoi on a accès)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Donne moi les caractéristiques d ‘une population.

A

1- Représente 100 % des informations concernant un phénomène ou un groupe.
2- La population représente LA VÉRITÉ ABSOLUE au sujet d’un phénomène, d’une caractéristique, de la relation entre deux variables, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Pourquoi est ce qu’on dit que la population représente la vérité absolue?

A

Théoriquement, c’est la vérité, car l’information est obtenue pour toutes les personnes / entités constituant la population. IL FAUT TOUTEFOIS AVOIR UNE MESURE VALIDE ET FIDELE.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Donc en stat c’est quoi la définition de la population?

A

L’ensemble des personnes / entités auxquelles s’appliquent les conclusions d’une recherche ou d’une analyse. ( en termes statistiques, c’est l’ensemble d’unités généralisé par un modèle statistique, l’échantillon)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

C’est quoi la différence entre le Recensement et le sondage?

A

Recensement: lorsqu’on prend une mesure a partir d’une population
Sondage: lorsqu’on prend une ensure a partir d’un échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qui définie la population?

A

La population doit être définie par le chercheur (il n’existe pas de population a priori)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Est il possible de mesurer une population, sinon, pourquoi?

A

Non, il est quasi impossible de mesurer une population a cause du coût, ressources, temps, accessibilité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

C’est quoi la définition en stat de l’échantillon ?

A

C’est l’information disponible au sujet d’un phénomène (sur une parcelle des membres de la population)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

C’est quoi la définition de l’inférence statistiques ?

A

L’inférence consiste à tirer une conclusion au sujet des caractéristiques de la population (qui sont inconnus) a partir des caractéristiques de l’échantillon (qui sont connus)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

C’est quoi la différence entre paramètre et statistique?

A

Paramètre: Caractéristiques de la distribution de la population
Statistique: Caractéristiques d’un échantillon ou de la distribution de la population par intermédiaire de l’inférence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Donne moi des exemples de caractéristiques de la distribution dune population.

A

Moyenne, variance, écart type, asymétrie, aplatissement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Les paramètres et les statistiques sont décrits avec quel alphabet?

A

Paramètre= alphabet grec
Statistiques= alphabet Latin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Donc grâce a ces concepts, c’est quoi la définition complète de l’inférence statistique?

A

L’inférence consiste à estimer les paramètres (caractéristiques de la population) à partir des statistiques (les caractéristiques de l’échantillon)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Est ce qu’il est possible de faire une erreur grâce a L’inférence statistiques?

A

Oui, un estimé implique toujours une probabilité. Donc quand on fait une estimation, il est possible de faire une erreur (erreur d’inférence)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est ce qu’il faut pour qu’on considère qu’un échantillon est représentatif?

A

Il faut que les caractéristiques de l’échantillon soient similaires a celles que l’on retrouve dans la population (la distribution d’un échantillon représentatif devrait ressembler a la distribution de la population)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Pourquoi c’est utile un échantillon représentatif ?

A

Économie de temps, d’argent et d’énergie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Est ce qu’on est sûre de la valeur des conclusions de l’étude réalisée a partir d’un échantillon ?

A

Il ya tjrs une incertitude permanente (car ce n’est pas toutes les personnes concernées d’une population qui sont interrogées)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est ce qu’on peut faire pour diminuer l’incertitude ?

A

D’où l’importance que l’échantillon sois représentatif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

C’est quoi les caractéristiques qui servent à évaluer la représentativité?

A

Les caractéristiques servant à évaluer la représentativité sont tribu aires du concept à évaluer (sexe, âge, origine)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Lorsqu’on connaît pas les paramètres (ex: très grande population), comment on constitue un échantillon représentatif?

A

Il faut utiliser l’échantillon aléatoire (grâce aux lois du hasard, l’échantillon sera la représentativité la plus fidèle de la population s’il contient un nombre suffisamment grand d’observations)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

C’est quoi les critères importants dans l’échantillon aléatoire ?

A

1- critère de la chance égale (randomisation, tout le monde a la meme chance d’être choisis)
2- critère de l’indépendance des réponses (la réponse d’une personne ne doit pas être influencée par la réponses d’une autre personne)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Donne moi des exemples ou le critère de l’indépendance des réponses n’est pas respecté?

A

1- vote a main levée
2- deux personnes d’une meme famille dans l’échantillon / un couple

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Aléatoirement, un échantillon plus grand a plus ou moins de chances d’inclure ces observations plus rares?
Aléatoirement, un échantillon plus grand a plus de chances d’inclure ces observations plus rares
26
Pour qu’un échantillon ai plus de chance d’être représentatif, il doit être grand ou petit ?
Il doit être grand (plus les statistiques vont s’approcher des paramètres)
27
Est ce que ça s’applique a tout type d’échantillon ?
Non, juste aux échantillons aléatoire
28
C’est quoi la corrélation entre la taille de l’échantillon et l’erreur de probabilité?
Plus l’échantillon est grand, plus ya d’erreurs de probabilité
29
Pourquoi est ce que le calcul pour écart type latin et écart type grec n’est pas le meme
1- Pour l'indépendance de score (le calcul de but, la moyenne de l'échantillon est identique)
30
C'est quoi la différence entre le calcul de la variance pour les paramètres et pour les statistiques?
La division pour les échantillons (statistiques) se fait par n-1= degrés de liberté Cette division produit un estimé non biaisé de la variance de la population à partir de la variance de l'échantillon
31
Explique moi davantage le degrés de liberté.
-Dans toute la population il existe des valeurs extrême, ce qui affecte la variance -Un échantillon restreint relativement à la population exclura probablement ces valeurs extrêmes (très rare) -La variance de l'échantillon sera alors plus petite que la variance dans la population = Biais
32
C'est quoi le biais lié au degrés de liberté?
La variance de l'échantillon sera plus petite que la variance dans la population (car les valeurs extrêmes seront exclus)
33
Pourquoi n-1 est rajouté dans la formule pour les statistiques comparés à pour les paramètres? (raison #1)
Je dois ajuster mon calcul pour compenser le biais en augmentant légèrement la variance de l'échantillon ce qui produit une meilleure estimation de la variance.
34
Est ce que le calcul de la moyenne pour les paramètres (population) et pour les statistiques (échantillon) sont identique?
Oui, la somme des observations est divisée par N ou n (chaque observation est indépendante)
35
Vrai ou Faux? Les statistiques estiment les paramètres seulement lorsque l’échantillon est aléatoire.
Vrai
36
La randomisation exige le respect des deux critères pour toutes les observations d’une distribution, quels sont-ils?
1- indépendance 2- chance égale
37
L’estimé « non biaisé » de s (calculé avec n - 1) est donc un meilleur estimé de μ. Mais il existe une dernière raison de l’utilisation de n – 1, c'est quoi?
Pour l'indépendance des scores (Les critères d’échantillon aléatoire exigent que chaque différence x- x̅ est indépendante, mais en réalité, cela n’est pas le cas. Un des écarts n’est jamais indépendant et il faut le retirer du calcul s =(X-x̅ )²/n - 1.)
38
Pourquoi avec la population, il faut pas diviser par n-1?
Car avec la population, on ne vient pas estimer la variance, on a la variance. Dans la population, c'est la vérité alors qu'avec un échantillon on vient estimer la vérité.
39
Vrai ou Faux? Si mon N est très grand, c'est pareil si je divise par N ou N-1.
Vrai (plus mon échantillon est grand, moins la correction du degrés de liberté, le n-1, a de l'importance)
40
Est ce qu'on prend quand même une mesure de prudence?
Néanmoins, par mesure de prudence, afin de distinguer s de σ nous utilisons toujours n -1 lorsque nous calculons la variance (et l’écart-type) de nos échantillons.
41
La méthode scientifique repose sur quel trois concepts centraux?
1- la théorie 2- l'hypothèse alternative 3- l'hypothèse nulle
42
C'est quoi la théorie en sciences humaines?
C'est une représentation de la réalité
43
C'est quoi une hypothèse alternative (H1)?
C'est la prédiction de l'effet attendu (La prédiction que la manipulation ou expérimentation aura un effet= Une conséquence observable qui sera vraie si la théorie est juste.)
44
C'est quoi une hypothèse nulle (H0)?
C'est l'inverse de H1 (la prédiction ou la théorie est fausse)
45
Comment appel-t-on l'ensemble de procédures logiques qui permettent de vérifier si l'hypothèse nulle est rejetée ou non?
La vérification de l'hypothèse (NHTS)
46
Que prédit l'hypothèse H1?
L’hypothèse (H1) prédit que quelque chose est vrai dans la population.
47
Comment on vérifie l'hypothèse n'ayant pas accès à la population?
L'hypothèse se vérifie par l'entremise des échantillons et des inférences.
48
C'est quoi la signification statistique?
La signification statistique porte directement sur la relation entre l’échantillon et la population. (corrélation ou différence "statistiquement significative" nous permet de faire une inférence)
49
Lorsqu'il s'agit d'une inférence, est ce que l'erreur est possible?
oui
50
Vrai ou Faux? Si H1 prédit qu’il y aura une différence ou une corrélation (par exemple), H0 prédit qu’il y aura des différence ou des corrélation.
Faux, Si H1 prédit qu’il y aura une différence ou une corrélation (par exemple), H0 prédit qu’il n’y aura pas de différence ou de corrélation.
51
Est ce que le rejet de H0 mènd à l'acceptation de H1?
oui
52
Est ce que le rejet de H1 mène à l'acceptation de H0.
Non
53
Si H0 ne peut pas être rejetée, est ce que cela veut nécessairement dire que H1 est fausse.
Non. Si H0 ne peut pas être rejetée, cela ne veut pas nécessairement dire que H1 est fausse. Nous sommes limités à dire «que nous ne pouvons pas accepter H1 »
54
À quoi servent les instruments de mesure valides et fidèles ? Pourquoi est-ce important en statistiques ?
On augmente la probabilité de commettre une erreur de type I ou II en concluant avec nos mesures (si j'ai un mauvais instrument de mesure, je peut faire une mauvais inférence, pas pcq mon phénomène n'existe pas mais pcq je l'ai pas bien évaluée)
55
Quels sont les 4 principaux concepts d'inférence?
1▫ Si H0 est rejetée (fausse), H1 est nécessairement vraie. 2▫ Si H0 n’est pas rejetée (n’est pas fausse), il n’y a pas de preuve confirmant H1 mais H1 n’est pas nécessairement fausse. 3▫ Nous ne pouvons jamais prouver qu’une H1 est fausse (que le phénomène n’existe pas) à partir d’un échantillon. 4▫ Pour prouver que quelque chose n’existe pas, il faut examiner la population complète, ce qui est généralement irréalisable.
56
Est ce que la méthode scientifique permet de conclure que quelque chose n'existe pas ?
Non, , la méthode scientifique ne permet jamais de conclure (i.e. de prouver) que quelque chose n’existe pas. Nous sommes limités à conclure qu’il n’y a pas de preuve (en fonction de la science actuelle) que la chose existe.
57
Donne des exemples de choses qu'on ne peut pas réfuter?
existence d'extra terrestres ou preuve d'intelligence divine
58
C'est quoi le concept le plus important pour comprendre le test de l’hypothèse et le concept de la signification statistique.
l'erreur d'échantillonnage
59
Est ce qu'il est probable que 2 échantillons de la même taille, extraits de la même population, aient des X̄ numériquement différentes?
Très probable, quasi certain
60
Explique la fluctuation des échantillons aléatoires.
n’importe quel échantillon extrait aléatoirement d’une population n’aura pas nécessairement la même X̄ que celle de sa population.
61
C'est quoi la définition de l'erreur d'échantillonnage?
La fluctuation naturelle entre les échantillons tirés de la même population (Différents échantillons extraits de la même population ne sont pas nécessairement composés des mêmes observations.)
62
C'est quoi l'erreur type de la moyenne?
La fluctuation naturelle entre les X̄ des échantillons tirés de la même population (La moyenne des échantillons extraits de la même population ne sera pas nécessairement numériquement la même.)
63
Vrai ou Faux? L’erreur d’échantillonnage et l’erreur type de la moyenne réfèrent à des principes différents.
L’erreur d’échantillonnage et l’erreur type de la moyenne réfèrent au même principe
64
Supposons que nous pouvons chiffrer l’erreur type de la moyenne (la fluctuation « naturelle » entre les X̄ des échantillons). L’erreur type = jusqu’à quel point puis-je tolérer qu’une moyenne d’échantillon soit différente d’une moyenne de population ?
Nouvelle règle d’inférence : - Rejet de H0 lorsque la différence entre la moyenne des échantillons (ou entre X̄ et μ) est plus grande que l’erreur type de la moyenne.
65
L'inférence consiste à conclure quoi?
L’inférence consiste à conclure H1 ou H0
66
Vrai ou Faux? En rejetant H0, nous disons que les échantillons ne proviennent probablement pas de la même population.
Vrai
67
Vrai ou Faux? Lorsque nous ne rejetons pas H0, nous ne pouvons pas inférer avec certitude que les échantillons ne proviennent pas de la même population.
Vrai
68
Ces décisions se basent sur quoi?
Ces décisions se basent sur des probabilités et non pas des certitudes/ faits : la conclusion (H1 ou H0) pourrait être fausse.
69
Comment on appel donc une conclusion fausse = une erreur?
Une erreur d'inférence
70
C'est quoi les 2 types d'erreurs
1- Erreur de type 1 (alpha) 2- Erreur de type 2 (beta)
71
C'est quoi l'erreur de type 1? (à apprendre par coeur)
Conclure qu’un phénomène existe alors qu’il n’existe pas consiste en une erreur de type I -Conclure qu’il existe une différence entre deux moyennes, un lien entre deux variables (etc.) alors qu’en réalité il n’existe pas de différence ou de lien. - Conclure à tort au rejet de H0.
72
Le faux positif est quel type d'erreur?
Erreur de type 1
73
C'est quoi l'erreur de type 2?
Conclure qu’un phénomène n’existe pas alors qu’il existe consiste en une erreur de type II (bêta; « type II error ») - Conclure qu’il n’existe pas de différence entre deux moyennes, aucun lien entre deux variables (etc.) alors qu’en réalité la différence ou le lien existe. - Conclure à tort au non-rejet de H0
74
Le faux négatif est une erreur de quel type?
Erreur de type 2
75
C'est quel type d'erreur qui rejette H0, alors qu’il ne le faudrait pas.
Erreur de type 1
76
C'est quel type d'erreur qui accepte/ non rejet de H0, alors qu’il ne le faudrait pas?
Erreur de type 2
77
Finis la phrase: Lorsqu’il est peu probable qu’un échantillon provient de la population μ, il est probable ...
qu’il vient d’une autre population ayant sa propre moyenne.
78
Comment mesurer concrètement l'erreur type de la moyenne?
intervalle de confiance (autour de la moyenne pour dire que j'aurais pu avoir une moyenne différente si j'aurais pris un échantillon différent)
79
L'inférence statistique consiste à décider quoi?
S'il est possible de rejeter l'hypothèse nulle (H0) Si l’échantillon et la population n’ont pas la même moyenne, nous rejetons H0 , sinon, nous ne la rejetons pas.
80
L'aspect aléatoire ramène quel problème?
À cause de l’aspect aléatoire, tous les échantillons extraits de la même population n’auront pas la même moyenne.
81
Comment appel-t-on cette variation naturelle?
L'erreur d'échantillonnage ou erreur type de la moyenne
82
La règle décisionnelle nous indique quoi?
Qu'on rejette H0 quand la différence entre X̄ et μ est bien plus grande que l'erreur type de la moyenne
83
C'est quoi les deux problèmes qu'on a à résoudre?
1- Il faut trouver une façon de calculer l’erreur type de la moyenne. 2- Définir ce que nous voulons dire par : la différence doit être « bien plus grande » que l’erreur type de la moyenne.
84
Qu'est ce qui peut nous venir en aide pour régler ces deux problèmes?
La distribution normale
85
Donne moi les étapes de l'expérience de l'échantillonnage.
1▫ Créons une population parfaitement normale. 2▫ Tirons aléatoirement tous les échantillons différents de la même taille (n). 3▫ Calculons la moyenne de chaque échantillon 4▫ Enfin, créons la distribution de ces moyennes
86
Quels sont les constats de l'expérience de l'échantillonnage?
1▫ La plupart des échantillons auront une proche de X̄, mais d’autres se trouveront plus loin. 2▫ La distribution des X̄ des échantillons sera invariablement normale si les échantillons sont « grands » 3▫ La moyenne des X̄ sera égale à μ.
87
Vrai ou faux? Les X̄ d'échantillons se distribueront de manière différente que les observations au sein de l'échantillon
Faux, ils se distribueront de la même manière
88
Qu'est ce qui se passe si je prend un nombre très grand de l'échantillon, indépendamment de la forme de la distribution?
Peut importe la forme de la distribution, si vous prenez un nombre infini/ très grand de l'échantillon la distribution des moyennes va toujours être normal
89
Les statistiques inférentielles paramétriques postule quoi?
Que les échantillons proviennent de population normalement distribué?
90
Est ce qu'il peut avoir une déviance dans la normalité?
oui
91
Vrai ou Faux? Les inférences sont valides seulement lorsque la population de référence est normale.
Vrai
92
Est ce qu'on peut faire des inférences avec des statistiques paramétriques?
non
93
Est ce qu'on peut faire des inférences avec des statistiques descriptives ou des statistiques non paramétriques?
oui
94
Est ce qu'il est requis que l'échantillon soit parfaitement normalement distribué?
Il n’est pas requis que l’échantillon soit parfaitement normalement distribué, mais il lui faut être aléatoirement extrait (Signifie que la symétrie et l’aplatissement ne sont pas trop élevés)
95
Si les échantillons sont tous extraits de la même population, mais que les observations des échantillons diffèrent et que les moyennes différentes, pourquoi?
À cause de l'erreur d'échantillonnage et l'erreur type des moyennes
96
Comment estime-t-on la taille de la fluctuation des X̄ ?
▫ Imaginons que nous tirons tous les échantillons de même taille d’une population et que nous calculons la X̄ de chaque échantillon. ▫ Calculons la différence moyenne (typique?) entre les X̄ . ▫ Ce calcul produit « un chiffre » qui spécifie le degré de fluctuation entre les X̄ .
97
L'estimation des fluctuation des X̄ ressemble à quoi?
À un écart type (fluctuation type, mais au niveau des échantillons et non de la distribution)
98
Décrit moi le processus pour obtenir l'erreur type de la moyenne.
1- Calculer la sommation (X̄ - μ) ce qui est toujours égale à 0 2- Mettre chaque différence au carré pour éliminer le problème que c tjrs égale à 0 3- Divise par K (le nombre d'échantillons) ce qui donne la variance des moyennes des échantillons 4- On fait la racine carré de tout ça
99
L'écart type des moyenne c'est quoi?
L'erreur type de la moyenne
100
Donc en résumé, c'est quoi l'erreur type de la moyenne?
C'est la fluctuation typique ou habituelle entre les moyennes des échantillons provenant de la même population
101
Pourquoi c'est pas applicable en pratique?
Car on a pas accès à toutes les échantillons provenant de la population.
102
Comment peut on déterminer l'erreur type de la moyenne si on a pas accès à toutes les échantillons provenant de la population?
On utilise un axiome statistique qui dit que la meilleure information que j'ai sur la population c'est l'information que j'ai sur mon échantillon
103
Pour calculer l'erreur type de la moyenne, il nous faut l'écart type de la population, ce qu'on a pas. Qu'est ce qu'on peut utiliser à la place?
L'écart type dans l'échantillon
104
C'est quoi la formule de l'écart type à la moyenne?
C'est l'écart type de l'échantillon (s) divisé par la racine carré du nombre de personnes dans l'échantillons (n)
105
Quels sont les 3 types d'erreurs? Nommes-les et donne a définition de chacun.
1- Écart type (Écart typique entre une observation et la moyenne) 2- Écart type d'échantillonnage (Plusieurs échantillons provenant de la même population ne contiendront pas les mêmes personnes) 3- Écart type de la moyenne (Écart typique entre la moyenne d’échantillons tirés de la même population)
106
107
108
109
110
111
112