Cours 4 - Tests d'hypothèses sur les moyennes et puissance statistique Flashcards by Emma Landry

Que se passe-t-il lorsqu’on pige plus d’échantillon dans une distribution d’échantillonnage (ex: n=30 vs n=2) ?

Plus il y a d’échantillons, plus l’écart-type rapetisse, et plus grande est la certitude que la moyenne d’échantillon soit proche de la vraie moyenne,

How well did you know this?

Not at all

Perfectly

Comment appelle-t-on l’écart-type d’une distribution d’échantillonnage ?

L’erreur standard

How well did you know this?

Not at all

Perfectly

Que peut-on dire de la moyenne d’échantillon si n=30 ?

La moyenne de l’échantillon est plus rarement loin de la moyenne de population

How well did you know this?

Not at all

Perfectly

Que peut-on dire de la moyenne d’échantillon si n=2 ?

La moyenne de l’échantillon est plus souvent loin de la moyenne de population

How well did you know this?

Not at all

Perfectly

Que se produit-il avec la variabilité de la distribution lorsque les échantillons sont plus grands ?

Elle diminue, c’est pourquoi l’erreur standard diminue aussi

How well did you know this?

Not at all

Perfectly

Signification de n=10

On a utilisé des échantillons de 10 unités chacun, pour calculer chacune des moyennes de la distribution d’échantillonnage

How well did you know this?

Not at all

Perfectly

Que dit le théorème central limite ?

Plus n des échantillons qu’on utilise pour distribution d’échantillonnage est grand, plus l’erreur standard est petite
On peut donc avoir confiance que n’importe quelle moyenne est en général plus près de la vraie moyenne de population

How well did you know this?

Not at all

Perfectly

Quand fait-on un test Z à une seule moyenne ?
Exemple diapos 16 à 35

On a 1 seul score qu’on veut comparer à une population
Quali
On connaît écart-type de population
On connaît moyenne de population ou on en a une bonne idée

How well did you know this?

Not at all

Perfectly

Que permet de faire le théorème central limite pour faire un test d’hypothèse sur des moyennes ?

Il permet de calculer ce dont on a besoins pour effectuer le test d’hypothèses

How well did you know this?

Not at all

Perfectly

Que signifie x avec une barre au dessus ?

Moyenne échantillon

How well did you know this?

Not at all

Perfectly

Que signifie mu ?

Moyenne population

How well did you know this?

Not at all

Perfectly

Que signifie sigma ?

Écart type population

How well did you know this?

Not at all

Perfectly

Que signifie s ?

Écart-type échantillon

How well did you know this?

Not at all

Perfectly

Selon le théorème central limite, considérant une population avec moyenne mu et variance sigma au carré, la distribution d’échantillonnage de la moyenne aura:

Une moyenne mu aussi
Une variance de sigma carré / n
Un écart-type de sigma / racine de n

La distribution s’approchera d’une distribution normal à mesure que n augmente

How well did you know this?

Not at all

Perfectly

Quelle est la formule du score z ?

z = x barre en haut - mu / sigma de l’échantillon (écart-type population /racine de n)

How well did you know this?

Not at all

Perfectly

Lorsqu’on obtient le score z (ex: 1.5) , que trouve-t-on lorsqu’on observe la table des z ?

La probabilité p d’obtenir un score z de 1,5 si H0 est vraie.

How well did you know this?

Not at all

Perfectly

Après avoir trouvé le p, que doit on faire dans le test z?

On doit observer quelles sont les probabilités d’obtenir une différence aussi grande que 1.34 dans une direction ou dans l’autre (extrémité droite et gauche du graph qui représentent la p)
On additionne donc p+pVoir

How well did you know this?

Not at all

Perfectly

Décision statistique du test Z

Voir diapo 34-35

How well did you know this?

Not at all

Perfectly

Quel test peut-on faire quand on ne connaît pas l’écart type de la population (sigma) ?

Test t de Student avec une seule moyenne

How well did you know this?

Not at all

Perfectly

Que faut-il avoir pour faire le test t de Student ?

Une seule moyenne

How well did you know this?

Not at all

Perfectly

Dans le test t sur un échantillon, comment peut-on estimer le paramètre sigma ?

On calcule s (l’écart-type pour un échantillon)
s = racine carrée de s2

How well did you know this?

Not at all

Perfectly

Dans un test t sur un échantillon, comment peut-on estimer le paramètre sigma 2 ?

On calcule s2 (variance échantillon)
Voir diapo 42

How well did you know this?

Not at all

Perfectly

Formule du test t

t = x barre en haut - mu / s sur la racine carrée de n

La façon la plus facile d’obtenir s est de d’abord calculer s2

How well did you know this?

Not at all

Perfectly

Par quoi remplace-t-on s/racine de n dans la formule du test t puisqu’On n’a pas le s ?

racine de s2 /n

How well did you know this?

Not at all

Perfectly

De quoi dépend la forme de distribution du t de Student ?

Nb de degrés de liberté

Comment calcule-t-on dl pour un test t avec un seul échantillon ?

dl = n-1

Quelle condition faut-il pour que la statistique t soit raisonnablement comparée à la distribution t ?

Il faut que l'échantillon ait un n assez grand pour que la distribution d'échantillonnage de la moyenne soit normale (n plus grand que 25 ou 30)

Condition d'application du test-t sur un échantillon ?

L'échantillon doit provenir d'une population distribuée normalement

Que se passe-t-il lorsque la distribution t a un dl= infini ?

t devient équibalent à z

Qu'est-ce que le t obtenu ?

Le t obtenu après utilisation de la formule du test t

Qu'est-ce que le t critique ?

Le t obtenu dans la table de Student

Que se passe-t-il quand le t obtenu est plus extrême que le t critique ?

On rejette H0 Si p est plus petit que alpha, on rejette H0 aussi

Quelle est la formule du test t avec 2 moyennes pour échantillons indépendants:

t = (valeur 1 - valeur 2) / erreur standard

Dans le test t avec 2 moyennes pour échantillons indépendants, comment conclue-t-on d'une différence significative ?

Quand la probabilité d'observer une valeur t est plus petite que celle fixée (seuil alpha)

Principale différence entre les différentes version du test :

Manière de calculer l'erreur standard

Lire et comprendre formule test t avec échantillons indépendants

60 à 71

À quoi sert l'estimation combinée de la variance (s au carré p) ?

Si les échantillons ne sont pas de même taille, on ne peut pas leur donner la même influence sur le calcul de l'erreur standard, donc on pondère leurs s2 par leurs degrés de liberté (n-1) voir formule diapo 72

Pourquoi peut-on calculer une taille d'effet ?

La valeur p seule ne nous dit pas grand chose.

Nomme une taille d'effet courante et explique ce qu'il indique

le d de Cohen Nb d'écarts-types qui sépare les 2 moyennes Il nous indique l'importance ou la magnitude de l'effet trouvé

Quelle est la formule du d de cohen ?

d= (x1 barre en haut - x2 barre en haut) / racine carrée de estimation combinée de variance

Comment est-il suggéré d'interpréter le d de Cohen ?

Petit: 0.2 Moyen: 0.5 Grand: 0.8

Conditions d'applicaition du test t sur échantillons indépendants :

Données sur échelle d'intervalle ou ration Normalité de distribution d'échantillonnahe (n>30) Indépendance des observations Homogénéité des variances N égaux, sinon, estimation combinée de variance

Quand peut-on qualifier de robuste un test-t ?

Quand il est peu affecté par des écarts modérés à ses conditions d'application, il fonctionne quand même même si on est un peu à côté des conditions

Qu'est-ce qu'un estimateur robuste ?

Peu affecté par les valeurs extrêmes Par exemple, la médiane est peu affectée par des données extrêmes ou aberrantes

Qu'est-ce que la puissance statistique ?

Probabilité de trouver un effet qui est réellement là En d'autres mots, probabilité de rejeter correctement l'hypothèse nulle quand l'hypothèse nulle est fausse

Pourquoi veut-on maximiser la puissance ?

Une plus grande puissance statistique nous aide à supporter notre hypothèse de recherche (H1)

Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est vraie ?

1 - alpha (non rejet correct)

Comment appelle-t-on: Rejeter H0 alors que H0 est vraie ?

Erreur de type 1 (erreur alpha)

Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est fausse ?

Erreur de type 2 (erreur beta)

Comment appelle-t-on: Rejeter H0 alors que H0 est fausse ?

1- Beta (rejet correct)

Puissance: Quand rejette-t-on l'hypothèse nulle ?

Si notre échantillon semble trop extrême par rapport à la distribution d'échantillonnage sous H0. Pour ce faire, on fixe le seuil alpha. Si moyenne d'échantillon est +extrême que seuil alpha, on rejette H0.

Observe la figure pour illustrer le concept de puissance statistique

Diapo 97

De quoi dépend la puissance ? (3)

1. Seuil alpha 2. Hypothèse alternative (H1) 3. Taille d'échantillon (n) et variance population

En quoi la puissance dépend-elle du seuil alpha ?

Augmenter le seuil alpha permet d'augmenter la puissance Cependant, cela augmente aussi le risque d'erreur de type 1 Faire un test unidirectionnel augmente aussi la puissance Voir diapo 99

En quoi la puissance dépend-elle de H1 ?

Plus la distribution d'échantillonnage de H1 est loin de celle de H0, plus la puissance est grande.

En quoi la puissance dépend-elle de la taille d'échantillon et de la variance?

Plus n est grand, plus erreur standard est petite, ce qui augmente la puissance Plus variance est petite, plus erreur standard est petite, ce qui augmente la puissance

Quelle est l'option la plus facile pour augmenter la puissance ?

Modifier n

Étapes pour calculer la taille d'échantillon requise pour une bonne puissance

1. Estimer taille d'effet attendue 2. Trouver delta 3. Faire les calculs

Comment peut-on estimer la taille d'effet attendue ?

Recherches antérieures Évaluation personnelle de ce qui serait important Utiliser les conventions spéciales (ex tableau proposé par Cohen 1998)

Que permet delta ?

Il nous permet de combiner n et d en un seul indice Pour le trouver, un utilise une table et on décide de la puissance qu'on veut avoir. Habituellement 0.8.

Comment fait-on le calcul de la taille d'échantillon ?

connaître la bonne formule selon test stat utilisé Exemple diapo 112 à 116

Quelle est la formule de taille d'échantillon pour test-t sur un seul échantillon ?

n = (delta sur d de cohen) exposant 2 Arrondir la réponse à la hausse

Points importants en lien avec les calculs liés à la puissance

- Mieux vaut utiliser un logiciel comme G*Power que calculer la puissance à la main. - Déterminer la taille d'échantillon dont on aura besoin AVANT de commencer une étude

Cours 4 - Tests d'hypothèses sur les moyennes et puissance statistique Flashcards

(63 cards)