COURS 7 Flashcards
(70 cards)
Le test t permet de répondre à quelle question?
est ce que la moyenne d’un groupe est différente de la moyenne d’un autre groupe (le test t compare la différence entre les deux moyennes à l’erreur d’échantillonnage)
Différence significative
Le test t est spécialement conçu pour les petits ou grands échantillons? Pourquoi?
Petit échantillon car la densité des observations des petits échantillons (la distribution t) n’est pas la même que celle avec des grands échantillons (z).
Le test t compare la différence entre les deux moyennes (Χ1 - Χ2) à une “marge d’erreur standard” appelée erreur-type de la moyenne. Explique.
Différence observée > Erreur-type ➔ Différence significative (rejet de H0, accepte H1))
Différence observée ≤ Erreur-type ➔ Pas de preuve que la différence est réelle (conserve H0)
En gros, le test t est parfait quand…
- Tu veux comparer deux groupes.
- Tu n’as pas assez de données pour utiliser la distribution z.
- Tu veux savoir si une différence est due au hasard ou à quelque chose de réel
Quels sont les 3 types du test t?
1- Test t pour un seul échantillon (Mon échantillon est-il différent d’une moyenne connue ?)
2- Test t pour deux échantillons indépendants (Ces deux groupes sont-ils vraiment différents?)
3- Test t pour deux échantillons non indépendants (Y a-t-il une amélioration avant/après une intervention?)
C’est quoi le test t pour un seul échantillon?
Un seul groupe comparé à une moyenne connue (déterminer si la moyenne d’un petit échantillon est différente de la moyenne connue de la population)
C’est quoi le test t pour deux échantillons indépendants?
Deux groupes différents comparés entre eux (détermine si deux petits échantillons ne proviennent pas de la même population)
C’est quoi le test t pour deux échantillons non indépendants?
Un même groupe mesuré à deux moments ou dans deux conditions (détermine si le même petit échantillon diffère sur la même variable mesurée à deux moments différents)
Explique la logique du test t
Le test t va comparer :
- La différence observée (la vraie différence que tu constates dans ton échantillon)
- La différence typique attendue due au hasard (appelée erreur-type de la moyenne)
Donne moi les étapes pour le test t?
1- Définir ce qu’est un petit échantillon
2- Calculer l’erreur type de la moyenne (erreur d’échantillonnage)
3- Comparer la moyenne de l’échantillon à celle de la population ou la moyenne de l’échantillon 1 à la moyenne de l’échantillon 2
4- Établir la règle décisionnelle permettant ou pas de rejeter H0
Pour le test t, c’est a quel point qu’on dit que l’échantillon est petit (assez petit pour utiliser le test t)?
30 (critère approximatif)
Que dit le théorème de la limite centrale?
- Le théorème de la limite centrale dit que si tu as beaucoup de données, la moyenne suit une belle courbe normale (courbe en cloche bien régulière). Mais avec peu de données, cette courbe devient plus “imprévisible” avec des extrémités plus épaisses
Pourquoi est ce qu’on dit qu’on dit que la distribution t a des extrémités plus épaisses que la distribution z?
Parce qu’avec peu de données, il y a plus de chances d’obtenir des résultats extrêmes juste par hasard (Plus ton échantillon est petit, plus tu peux obtenir des résultats qui sortent de l’ordinaire, d’où ces “extrémités épaisses” dans la distribution t.)
Est ce que la distribution t est différente/ change en fonction de la taille de l’échantillon?
Oui (a fur et à mesure que n augmente, la forme de t ressemble de plus en plus à la distribution z)
➡️ Petit échantillon (ex. : n = 5) ➔ Distribution t avec des extrémités TRÈS épaisses.
➡️ Grand échantillon (ex. : n = 120) ➔ La distribution t commence à ressembler à la distribution z.
➡️ Échantillon infini (n = ∞) ➔ La distribution t et la distribution z deviennent identiques.
C’est quoi la différence principale entre la distribution t et z?
la largeur de l’intervalle de confiance (IC)= Plus l’échantillon est petit, plus ton IC est large pour compenser l’incertitude.
➡️ Avec la courbe normale (z), 95 % des observations sont à ± 1,96 erreurs-types de la moyenne.
➡️ Avec la courbe t, 95 % des observations sont plus éloignées (ex. ± 2,5 erreurs-types pour un petit échantillon).
Exemple:
Avec z : IC = [7 à 9]
Avec t : IC = [6 à 10]
Vrai ou Faux: Moins j’ai de gens dans mon échantillon, plus j’ai de chances d’avoir un nombre égale en haut vs en bas de la moyenne
Faux, plus j’ai de gens dans mon échantillon, plus j’ai de chances d’avoir un nombre égale en bas et en haut de la moyenne (moyenne plus représentatif)
Est ce que la distribution t reste la même no matter what (comme la distribution z)?
non, elle change de forme dépendamment du nombre de personnes dans l’échantillon
Avec la distribution t, 95 % des Χ des échantillons extraits de la population se
situent à un nombre d’erreurs-type différent de , dépendamment du nombre d’observations dans les échantillons (n).
n = 3: 95 % des Χ se situeront à ± 4,3 erreurs types de .
n = 5: 95 % des Χ se situeront à ± 2,78 erreurs types de .
n = 31 : 95 % des Χ se situeront à ± 2,04 erreurs types de .
n = 100 : 95 % des Χ se situeront à ± 1,98 erreurs types de .
n = 120+ : 95 % des Χ se situeront à ± 1,96 erreurs types de .
Est ce que le test t fonctionne seulement pour les petits échantillons?
non il marche avec les plus grand aussi mais il est spécialement conçu pour les petits échantillons
On fait quoi si on travail avec un grand échantillon (test t pour un seul échantillon)?
- Nous calculons l’erreur type de la moyenne de l’échantillon
- Nous établissons un intervalle de confiance
- Si l’intervalle de confiance exclut la moyenne de la population, nous rejetons H0
Comment calculer et d’interpréter un intervalle de confiance (IC) pour les petits échantillons en utilisant la distribution t?
L’intervalle de confiance (IC) est une fourchette dans laquelle tu es à 95 % sûr que la vraie moyenne se trouve.
( IC = X̄ ± z * sX̄ ) Cette formule est parfaite pour les grands échantillons (n ≥ 30), mais elle devient trop optimiste avec les petits échantillons. Avec peu de données, tu risques de sous-estimer les fluctuations possibles.
Pour compenser cette incertitude supplémentaire, on remplace le z par un t critique, qui est une valeur plus grande et adaptée aux petits échantillons.
C’est quoi le t critique?
Le t critique est une valeur clé dans la distribution t qui te dit jusqu’où élargir ton IC pour être sûr à 95 % (ou à un autre seuil) que la vraie moyenne est bien dedans.
Comment trouver le t critique ?
On utilise une table des valeurs critiques de t (souvent appelée “table de Student”).
On a besoin du niveau de confiance et du degré de liberté
C’est quoi le degré de liberté pour le test t pour un seul échantillon?
n-1 (on perd un degré de liberté car on travail avec une seule moyenne)