Cours 4 - Tests d'hypothèses sur les moyennes et puissance statistique Flashcards

(63 cards)

1
Q

Que se passe-t-il lorsqu’on pige plus d’échantillon dans une distribution d’échantillonnage (ex: n=30 vs n=2) ?

A

Plus il y a d’échantillons, plus l’écart-type rapetisse, et plus grande est la certitude que la moyenne d’échantillon soit proche de la vraie moyenne,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment appelle-t-on l’écart-type d’une distribution d’échantillonnage ?

A

L’erreur standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que peut-on dire de la moyenne d’échantillon si n=30 ?

A

La moyenne de l’échantillon est plus rarement loin de la moyenne de population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que peut-on dire de la moyenne d’échantillon si n=2 ?

A

La moyenne de l’échantillon est plus souvent loin de la moyenne de population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que se produit-il avec la variabilité de la distribution lorsque les échantillons sont plus grands ?

A

Elle diminue, c’est pourquoi l’erreur standard diminue aussi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Signification de n=10

A

On a utilisé des échantillons de 10 unités chacun, pour calculer chacune des moyennes de la distribution d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que dit le théorème central limite ?

A
  1. Plus n des échantillons qu’on utilise pour distribution d’échantillonnage est grand, plus l’erreur standard est petite
  2. On peut donc avoir confiance que n’importe quelle moyenne est en général plus près de la vraie moyenne de population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quand fait-on un test Z à une seule moyenne ?
Exemple diapos 16 à 35

A
  • On a 1 seul score qu’on veut comparer à une population
  • Quali
  • On connaît écart-type de population
  • On connaît moyenne de population ou on en a une bonne idée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que permet de faire le théorème central limite pour faire un test d’hypothèse sur des moyennes ?

A

Il permet de calculer ce dont on a besoins pour effectuer le test d’hypothèses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que signifie x avec une barre au dessus ?

A

Moyenne échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que signifie mu ?

A

Moyenne population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que signifie sigma ?

A

Écart type population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que signifie s ?

A

Écart-type échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Selon le théorème central limite, considérant une population avec moyenne mu et variance sigma au carré, la distribution d’échantillonnage de la moyenne aura:

A
  1. Une moyenne mu aussi
  2. Une variance de sigma carré / n
  3. Un écart-type de sigma / racine de n

La distribution s’approchera d’une distribution normal à mesure que n augmente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est la formule du score z ?

A

z = x barre en haut - mu / sigma de l’échantillon (écart-type population /racine de n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Lorsqu’on obtient le score z (ex: 1.5) , que trouve-t-on lorsqu’on observe la table des z ?

A

La probabilité p d’obtenir un score z de 1,5 si H0 est vraie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Après avoir trouvé le p, que doit on faire dans le test z?

A

On doit observer quelles sont les probabilités d’obtenir une différence aussi grande que 1.34 dans une direction ou dans l’autre (extrémité droite et gauche du graph qui représentent la p)
On additionne donc p+pVoir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Décision statistique du test Z

A

Voir diapo 34-35

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quel test peut-on faire quand on ne connaît pas l’écart type de la population (sigma) ?

A

Test t de Student avec une seule moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Que faut-il avoir pour faire le test t de Student ?

A

Une seule moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Dans le test t sur un échantillon, comment peut-on estimer le paramètre sigma ?

A

On calcule s (l’écart-type pour un échantillon)
s = racine carrée de s2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Dans un test t sur un échantillon, comment peut-on estimer le paramètre sigma 2 ?

A

On calcule s2 (variance échantillon)
Voir diapo 42

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Formule du test t

A

t = x barre en haut - mu / s sur la racine carrée de n

La façon la plus facile d’obtenir s est de d’abord calculer s2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Par quoi remplace-t-on s/racine de n dans la formule du test t puisqu’On n’a pas le s ?

A

racine de s2 /n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
De quoi dépend la forme de distribution du t de Student ?
Nb de degrés de liberté
25
Comment calcule-t-on dl pour un test t avec un seul échantillon ?
dl = n-1
26
Quelle condition faut-il pour que la statistique t soit raisonnablement comparée à la distribution t ?
Il faut que l'échantillon ait un n assez grand pour que la distribution d'échantillonnage de la moyenne soit normale (n plus grand que 25 ou 30)
27
Condition d'application du test-t sur un échantillon ?
L'échantillon doit provenir d'une population distribuée normalement
28
Que se passe-t-il lorsque la distribution t a un dl= infini ?
t devient équibalent à z
29
Qu'est-ce que le t obtenu ?
Le t obtenu après utilisation de la formule du test t
30
Qu'est-ce que le t critique ?
Le t obtenu dans la table de Student
31
Que se passe-t-il quand le t obtenu est plus extrême que le t critique ?
On rejette H0 Si p est plus petit que alpha, on rejette H0 aussi
32
Quelle est la formule du test t avec 2 moyennes pour échantillons indépendants:
t = (valeur 1 - valeur 2) / erreur standard
33
Dans le test t avec 2 moyennes pour échantillons indépendants, comment conclue-t-on d'une différence significative ?
Quand la probabilité d'observer une valeur t est plus petite que celle fixée (seuil alpha)
34
Principale différence entre les différentes version du test :
Manière de calculer l'erreur standard
35
Lire et comprendre formule test t avec échantillons indépendants
60 à 71
36
À quoi sert l'estimation combinée de la variance (s au carré p) ?
Si les échantillons ne sont pas de même taille, on ne peut pas leur donner la même influence sur le calcul de l'erreur standard, donc on pondère leurs s2 par leurs degrés de liberté (n-1) voir formule diapo 72
37
Pourquoi peut-on calculer une taille d'effet ?
La valeur p seule ne nous dit pas grand chose.
38
Nomme une taille d'effet courante et explique ce qu'il indique
le d de Cohen Nb d'écarts-types qui sépare les 2 moyennes Il nous indique l'importance ou la magnitude de l'effet trouvé
39
Quelle est la formule du d de cohen ?
d= (x1 barre en haut - x2 barre en haut) / racine carrée de estimation combinée de variance
40
Comment est-il suggéré d'interpréter le d de Cohen ?
Petit: 0.2 Moyen: 0.5 Grand: 0.8
41
Conditions d'applicaition du test t sur échantillons indépendants :
Données sur échelle d'intervalle ou ration Normalité de distribution d'échantillonnahe (n>30) Indépendance des observations Homogénéité des variances N égaux, sinon, estimation combinée de variance
42
Quand peut-on qualifier de robuste un test-t ?
Quand il est peu affecté par des écarts modérés à ses conditions d'application, il fonctionne quand même même si on est un peu à côté des conditions
43
Qu'est-ce qu'un estimateur robuste ?
Peu affecté par les valeurs extrêmes Par exemple, la médiane est peu affectée par des données extrêmes ou aberrantes
44
Qu'est-ce que la puissance statistique ?
Probabilité de trouver un effet qui est réellement là En d'autres mots, probabilité de rejeter correctement l'hypothèse nulle quand l'hypothèse nulle est fausse
45
Pourquoi veut-on maximiser la puissance ?
Une plus grande puissance statistique nous aide à supporter notre hypothèse de recherche (H1)
46
Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est vraie ?
1 - alpha (non rejet correct)
47
Comment appelle-t-on: Rejeter H0 alors que H0 est vraie ?
Erreur de type 1 (erreur alpha)
48
Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est fausse ?
Erreur de type 2 (erreur beta)
49
Comment appelle-t-on: Rejeter H0 alors que H0 est fausse ?
1- Beta (rejet correct)
50
Puissance: Quand rejette-t-on l'hypothèse nulle ?
Si notre échantillon semble trop extrême par rapport à la distribution d'échantillonnage sous H0. Pour ce faire, on fixe le seuil alpha. Si moyenne d'échantillon est +extrême que seuil alpha, on rejette H0.
51
Observe la figure pour illustrer le concept de puissance statistique
Diapo 97
52
De quoi dépend la puissance ? (3)
1. Seuil alpha 2. Hypothèse alternative (H1) 3. Taille d'échantillon (n) et variance population
53
En quoi la puissance dépend-elle du seuil alpha ?
Augmenter le seuil alpha permet d'augmenter la puissance Cependant, cela augmente aussi le risque d'erreur de type 1 Faire un test unidirectionnel augmente aussi la puissance Voir diapo 99
54
En quoi la puissance dépend-elle de H1 ?
Plus la distribution d'échantillonnage de H1 est loin de celle de H0, plus la puissance est grande.
55
En quoi la puissance dépend-elle de la taille d'échantillon et de la variance?
Plus n est grand, plus erreur standard est petite, ce qui augmente la puissance Plus variance est petite, plus erreur standard est petite, ce qui augmente la puissance
56
Quelle est l'option la plus facile pour augmenter la puissance ?
Modifier n
57
Étapes pour calculer la taille d'échantillon requise pour une bonne puissance
1. Estimer taille d'effet attendue 2. Trouver delta 3. Faire les calculs
58
Comment peut-on estimer la taille d'effet attendue ?
Recherches antérieures Évaluation personnelle de ce qui serait important Utiliser les conventions spéciales (ex tableau proposé par Cohen 1998)
59
Que permet delta ?
Il nous permet de combiner n et d en un seul indice Pour le trouver, un utilise une table et on décide de la puissance qu'on veut avoir. Habituellement 0.8.
60
Comment fait-on le calcul de la taille d'échantillon ?
connaître la bonne formule selon test stat utilisé Exemple diapo 112 à 116
61
Quelle est la formule de taille d'échantillon pour test-t sur un seul échantillon ?
n = (delta sur d de cohen) exposant 2 Arrondir la réponse à la hausse
62
Points importants en lien avec les calculs liés à la puissance
- Mieux vaut utiliser un logiciel comme G*Power que calculer la puissance à la main. - Déterminer la taille d'échantillon dont on aura besoin AVANT de commencer une étude