Cours 2 - Tests statistiques utilisés pour comparer des groupes , 1 : Test t à un n Flashcards
(46 cards)
Le test t peut ê utilisé pour rép à des questions de recherche pour des modèles impliquant..
-un seul n
-des n appariés
-deux n indépendants
Les analyses de variances peuvent ê utilisées pour rép à des questions de recherche pour des modèles impliquant
2 moyennes ou plus.
Les _____ peuvent ê utilisées pour rép à des questions de recherche pour des modèles impliquant 2 moyennes ou plus.
Les ANALYSES DE VARIANCES peuvent ê utilisées pour rép à des questions de recherche pour des modèles impliquant 2 moyennes ou plus.
Un test t à un n évalue..
si une moyenne est égale à une « valeur de test » basée sur l’hypo de recherche
Un test t à n appariés évalue..
si la différence des moyennes entre des observations appariées est diff de 0
Un test t à n indépendants évalue..
si les moyennes de 2 gr indépendants sont statistiquement diff l’une de l’autre
Le test t est un type d’analyse stat couramment utilisé en psycho, particulièrement quand.. (3 éléments).
Pour comparer…
-les données respectent l’hypo de normalité de la distribution,
-les variances entre les gr sont homogènes
-les observations sont indépendantes
Pour comparer les moyennes de 2 gr et déterminer si les diff observées sont stat signi (p < 0,05) ou non signi (p > 0,05).
Des méthodes statistiques actuelles comme ______ sont appliquées lorsque la distribution des données n’est pas normale (pour faire test t)
le bootstrap
Le bootstrap permet…
D’estimer la distribution d’une stat en rééchantillonnant les données d’origine, offrant ainsi une alternative robuste aux tests para qui supposent la normalité.
(Contexte de test t) Donc si ma distribution est pas normale, si je perds de la puissance dans mes analyses pcq n trop petit, il y a des façons de régler le prob, et c’est
le bootstrap.
Statistique t, synonyme =
stat de test d’hypo
Test t à un n, synonyme =
Test t à n unique
Un test t à un n permet d’évaluer si la moyenne de notre échantillon diffère d’une valeur constante connue, souvent désignée comme la “valeur de test”. Cette valeur de référence à :
1) Un pnt médian de la distribution de la variable test
2) Une valeur moyenne de la vari test sur la base de recherches précédentes
3) Le niv de chance de performance pour la vari test.
La situation suivante est un exemple de quel type de « valeur de test » que l’on peut utiliser dans un test t à un n ?
o Marcos souhaite déterminer si les étudiants ont une opinion négative ou positive des dirigeants mondiaux actuels. Il a élaboré l’Échelle Balbinotti des leaders mondiaux (ÉBLM), qui comprend les noms de 15 leaders mondiaux. Il demande à 100 étudiants d’identifier le pays que chaque dirigeant gouverne et de noter le dirigeant sur une échelle de 1 à 9, où 1 = un dirigeant fortement inutile, 5 = un dirigeant ni inutile ni valable, et 9 = un dirigeant fortement valable. Le score ÉBLM d’un élève est la note moyenne des dirigeants dont les pays ont été correctement identifiés. Marcos effectue un test t à un échantillon sur les 100 scores ÉBLM pour déterminer si la moyenne de son échantillon est différente de 5. La valeur de test de 5 a été choisie parce qu’une valeur inférieure à 5 implique une vision plus négative des dirigeants mondiaux, une valeur supérieure à 5 implique une vision plus positive des dirigeants mondiaux, et une valeur de 5 implique une vision ni négative ni positive des dirigeants mondiaux.
1) pnt médian de la distribution variable test
La situation suivante est un exemple de quel type de « valeur de test » que l’on peut utiliser dans un test t à un n ?
o Marcos souhaite déterminer si les adolescents qui ne pratiquent pas de sport présentent un niveau de dépression supérieur à la moyenne des adolescents en général. Pour tester cette hypothèse, il recueille les scores de l’Échelle Balbinotti de Dépression (ÉBD) auprès de 30 adolescents ayant déclaré ne pas pratiquer de sport en dehors des cours d’éducation physique à l’école. L’ÉBD est un instrument de mesure validé et normalisé, avec une moyenne de 50 pour les adolescents de sexe masculin. Marcos réalise un test t à un échantillon sur ces 30 scores ÉBD afin de vérifier si la moyenne de cet échantillon diffère de la valeur de référence de 50.
2) Valeur moyenne de la vari test sur la base de recherches précédentes
(Contexte de test t à un n, 2) valeur moyenne de la vari test sur la base de recherches précédentes)
Dans cet exemple, pq la valeur de référence 50 a-t-elle été choisie?
o Marcos souhaite déterminer si les adolescents qui ne pratiquent pas de sport présentent un niveau de dépression supérieur à la moyenne des adolescents en général. Pour tester cette hypothèse, il recueille les scores de l’Échelle Balbinotti de Dépression (ÉBD) auprès de 30 adolescents ayant déclaré ne pas pratiquer de sport en dehors des cours d’éducation physique à l’école. L’ÉBD est un instrument de mesure validé et normalisé, avec une moyenne de 50 pour les adolescents de sexe masculin. Marcos réalise un test t à un échantillon sur ces 30 scores ÉBD afin de vérifier si la moyenne de cet échantillon diffère de la valeur de référence de 50.
-une valeur < 50 suggère un niv de dépression inférieur à celui d’un ado masc moyen
-une valeur > 50 indique un niv de dépression + élevé
-une valeur = 50 n’implique ni plus ni moins de dépression qu’un ado masc moyen
La situation suivante est un exemple de quel type de « valeur de test » que l’on peut utiliser dans un test t à un n ?
Marcos pense que le Test Balbinotti d’identification visuelle (TBIV) est trop difficile pour les enfants de moins de cinq ans. Ce test comprend 24 items, où, pour chaque item, une image est montrée à l’enfant pendant deux secondes. Après un délai de cinq secondes, l’enfant doit identifier cette même image parmi trois autres options. Pour évaluer cette hypothèse, Marcos recueille les scores au TBIV de 75 enfants âgés de quatre ans et réalise un test t à un échantillon pour déterminer si la moyenne des scores est différente du niveau attendu par le hasard. La probabilité qu’un enfant réponde correctement à une question est d’une sur trois, et avec 24 items au total, le niveau de chance pour l’ensemble du test est de 8 (1/3 x 24).
3) Le niveau de chance de performance pour la variable test
(Contexte de test t à un n, 2) valeur moyenne de la vari test sur la base de recherches précédentes)
Dans cet exemple, qui signifie le 8?
Marcos pense que le Test Balbinotti d’identification visuelle (TBIV) est trop difficile pour les enfants de moins de cinq ans. Ce test comprend 24 items, où, pour chaque item, une image est montrée à l’enfant pendant deux secondes. Après un délai de cinq secondes, l’enfant doit identifier cette même image parmi trois autres options. Pour évaluer cette hypothèse, Marcos recueille les scores au TBIV de 75 enfants âgés de quatre ans et réalise un test t à un échantillon pour déterminer si la moyenne des scores est différente du niveau attendu par le hasard. La probabilité qu’un enfant réponde correctement à une question est d’une sur trois, et avec 24 items au total, le niveau de chance pour l’ensemble du test est de 8 (1/3 x 24).
-Score < 8 indique que les enfants de 4 ans performent moins bien que le hasard
-Score > 8 indique que les enfants de 4 ans performent mieux que le hasard
-Un score de 8 signifie que leur performance correspond exactement au niveau attendu par le hasard.
Quels sont les prérequis (conditions d’appli) d’un test t à un n?
1) La distribution des données doit ê normale
2) L’homogénéité de la variance
3) Indépendance des données
Attention si Puissance et distribution non normale
(chaque élément détaillé plus tard)
P/r aux conditions d’appli des test t à un n, ..
1) La distribution des données doit ê normale,
2 précisions:
Dans de nombreuses applications, avec une taille d’échantillon modérée (N ≈ 15), le test t à un échantillon peut fournir des valeurs p relativement précises, même en cas de légère violation de la normalité.
Cependant, pour des tailles d’échantillon plus grandes, il peut être nécessaire d’augmenter la taille de l’échantillon pour produire des valeurs p valides, surtout si la distribution de la population est substantiellement non-normale.
P/r aux conditions d’appli des test t à un n, ..
1) La distribution des données doit ê normale,
Comment on fait pour tester et comment on choisit le test?
-On va utiliser le test KS (Kolmogorov-Smirnov) quand n > 50
ou le SW (Shapiro-Wilk) quand n < 50
pour tester la normalité.
P/r aux conditions d’appli des test t à un n, ..
1) La distribution des données doit ê normale, donc si je fais un test KS ou SW et que pas normale, qu’est-ce que je vais faire ensuite?
Je peux faire bootstrap OU
utiliser le non-paramétrique (pas bin bin utilisé ajd)
P/r aux conditions d’appli des test t à un n, ..
2) L’homogénéité de la variance,
Explication générale
Si plusieurs gr sont comparés, il est important que les variances entre les gr soient similaires. Une violation de cette hypo peut influencer les résultats du test t.
P/r aux conditions d’appli des test t à un n, ..
2) L’homogénéité de la variance,
un test qui regarde ça?
Analyse de Levene.