Cours 4 - Traduction, développement de tests et validation de contenu Flashcards

1
Q

Quels sont les trois types de biais possibles?

A
  • Biais de construit
  • Biais de méthode
  • Biais d’items
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que le biais de construit?

A

Lorsque le construit mesuré est différent en termes de conceptualisation (par exemple, définitions différentes de l’intelligence qui inclut ou non les habiletés de communication) ou de comportements associés au construit (par exemple, être un bon enfant en Chine est plus exigeant qu’en occident). Lorsqu’on soupçonne l’existence d’une telle tendance ethnocentrique, il faut alors effectuer une enquête avec une équipe multiculturelle et multilingue ayant une expertise en regard du construit.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que le biais de méthode?

A

Réfère à la façon dont le test est administré, ce qui peut en affecter la validité. Plusieurs sources possibles incluant des différences dans : les effets de l’examinateur, la désirabilité sociale, la familiarité avec les items, la familiarité avec le format des items (choix multiples ou échelle de Likert), les situations de test en général. Une façon d’évaluer ce biais est de mesurer le construit de différentes manières (triangulation de la mesure) ou d’utiliser une mesure répétée. On peut aussi mesurer la désirabilité sociale ou administrer le test d’une façon non standard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que le biais d’items?

A

Inclut la faiblesse de la langue, le contenu inapproprié des items et la traduction inadéquate. Les items sont biaisés si deux groupes ayant le même score global ont des résultats attendus différents aux items. Pour des items dichotomiques, une façon d’évaluer ce biais est le test de Mantel-Haenszel. Pour des items à intervalles, on peut utiliser des analyses de variance où les groupes et les scores globaux sont les variables indépendantes et le résultat à l’item est la variable dépendante.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Lorsqu’on assume qu’il n’y a qu’une possibilité de biais d’items, une traduction littérale peut être utilisée. Qu’est-ce que la traduction littérale?

A

Il s’agit alors de faire la traduction et une « back translation » que l’on compare. Après une possible révision, le test est administré aux groupes source et cible et les résultats sont comparés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les possibilités face à un biais de construit ou un biais de méthode?

A

Adapter le test de différentes façons :

  • adaptation des items
  • adaptation du format des items
  • entraînement de l’examinateur
  • emploie de la triangulation.

Lorsqu’on voudra par la suite comparer l’ancien test au nouveau, il faudra utiliser une analyse factorielle confirmatoire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les changements les plus radicaux sont habituellement reliés à quel type de biais?

A

Au biais de construit où l’on doit parfois éliminer complètement un ou des items. Si ce biais est trop fort, il vaut mieux procéder à la création d’un nouveau test que d’en traduire un. L’intérêt n’est pas alors de comparer les scores dans les deux groupes, mais de s’assurer que le même construit est mesuré, ce qui peut se faire en utilisant des analyses de régression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les cinq étapes d’élaboration d’un test?

A
  1. La détermination des utilisations prévues du test
  2. La définition de ce que l’on souhaite mesurer
  3. La création des items
  4. L’évaluation des items
  5. La détermination des propriétés métriques du test définitif
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que la détermination des utilisations prévues du test?

A

Les usages prévisibles d’un test déterminent grandement ses caractéristiques.

Quels sont les buts du test ? Par exemple, servira-t-il principalement à sélectionner les meilleurs sujets dans un groupe ou servira-t-il principalement à évaluer si un individu maîtrise les compétences attendues en fin d’année scolaire? Dans le premier cas, il s’agira d’un test normé et dans le second d’un test critérié, ce qui conditionnera la méthodologie de construction utilisée.

À quelle clientèle est-il destiné ? Est-ce que le test sera utilisé auprès de la population en général ou avec des populations spécifiques telles que seulement des enfants, ou seulement des adultes, ou seulement des déficients mentaux, etc. ?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que la définition de ce que l’on souhaite mesurer?

A

Habituellement, le point de départ d’un test est un objectif relativement vague et général (par exemple, diagnostiquer les troubles d’attention ou sélectionner des secrétaires) qu’il faut opérationnaliser. Il faut donc déterminer soit la portée de la construction mentale (attention) ou l’étendue du domaine mesuré (compétences d’une bonne secrétaire).

L’élaboration du plan de la structure du test sera guidée soit par la théorie dans le cas de la mesure d’un construit mental ou soit par une analyse de contenu de domaine de comportements ou des exigences d’emploi dans le cas de la mesure d’un domaine de comportements.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que la création des items?

A

Il faut tout d’abord choisir le format des items (par exemple, questions fermées ou ouvertes) en fonction des objectifs du test et des conditions de création, de passation et de cotation.

On détermine par la suite le niveau de difficulté des items en fonction des objectifs du test et en fonction du type de test (par exemple, normé ou critérié).

Enfin, on décide du nombre d’items à créer en fonction de la durée du test et en fonction du niveau de fidélité recherché. Il est à noter qu’il faut prévoir entre 30 à 50% plus d’items que ce que l’on désire, car on éliminera des items lors de la mise à l’essai. On passe alors à la rédaction des items.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que l’évaluation des items?

A

Les items sont évalués de deux façons, d’abord par des juges, puis par une mise à l’essai des items.
Les juges apprécient la conformité des items aux exigences définies lors de la seconde étape, i.e. suite à la définition opérationnelle de ce que l’on souhaite mesurer.
La mise à l’essai consiste à faire passer tous les items à un échantillon restreint de la population. Les résultats sont ensuite analysés de façons qualitative et quantitative (niveau de difficulté, pouvoir discriminant) afin de sélectionner les meilleurs items qui serviront à construire la version définitive du test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la détermination des propriétés métriques du test définitif?

A

Les propriétés métriques, qui seront rapportées dans un manuel accompagnant le test, sont déterminées suite à la passation du test à un échantillon normatif.
Il faut tout d’abord établir des normes (pour un test normé) ou des scores de référence (pour un test critérié).

Il faut par la suite faire des analyses de fidélité et de validité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la validité de contenu?

A

La validation de contenu est une méthode qui consiste à analyser le contenu du test afin de s’assurer qu’il est représentatif en tant qu’échantillon du domaine de comportements à mesurer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont les deux questions à se poser par rapport à la validité et la représentativité?

A
  1. À quel point chaque item ou question qui forme le test appartient à l’univers du construit défini?
  2. À quel point l’ensemble des items ou des questions représente tous les aspects de cet univers?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle est la seule façon de juger la représentativité du test?

A

Par rapport à la définition donnée au construit mesuré.

17
Q

Quelle est la différence entre la validité apparante et la validité de contenu?

A

La validité apparente correspond à ce que le test semble mesurer, i.e. est-ce que le test semble valide aux yeux des examinés, du personnel administratif, des observateurs non- initiés, etc.

Ceci est donc différent de la question de ce que le test mesure de fait. On peut augmenter la validité apparente en modifiant quelque peu les questions afin qu’elles paraissent plus pertinentes aux examinés.

18
Q

Quelles sont les étapes de la procédure de validation de contenu?

A
  1. La détermination des utilisations prévues du test
  2. La définition de ce que l’on souhaite mesurer
  3. La création des items
  4. L’évaluation des items
19
Q

La création des items dans la validation de contenu est différente la création d’item durant l’élaboration d’un test. Quelles sont les différences?

A

Lorsqu’on a déterminé le format, le niveau de difficulté et le nombre d’items à créer « devis de rédaction », on passe alors à la première rédaction en s’aidant d’une « table croisée de spécification ».

Par exemple, pour un test final d’un cours d’introduction à la psychométrie, on pourrait avoir le tableau suivant qui donne la répartition du nombre de questions selon les champs de contenu et les objectifs d’apprentissage. Un tel tableau rend plus explicite la rédaction du test.

Par la suite, on rédige les items pour chaque catégorie de la table (correspondant à chaque aspect important du domaine ou de la tâche), ce qui crée la banque initiale d’items.

Ensuite, on détermine la structure du test : Ordre (séquentielle et logique) des items dans le test (par exemple difficulté croissante); Organisation en sous-tests distincts ou mélange des items

20
Q

Quel élément pertinent du domaine d’application de la validation de contenu est important de mentionner?

A

La validation de contenu est une méthode qui ne s’applique pas aussi aisément à tous les types de tests psychologiques.

21
Q

La validation de contenu s’applique bien aux…

A
  • Tests de rendement typique ou optimal, occupationnel ou scolaire.

Dans ce dernier cas, on parle alors de validité didactique pour savoir si le contenu d’un test a bien été couvert dans un programme pédagogique.

  • Tests de sélection et de classification
22
Q

La validation de contenu s’applique plus difficilement aux…

A
  • Tests de personnalité et d’aptitudes, puisque:
  • Relation plus lointaine entre les items du test et les caractéristiques mesurées traditionnellement dans ces tests
  • Conception des aptitudes et de la personnalité comme des traits plutôt que comme des performances situationnelles
  • Les théories à la base de ces tests supposent l’existence d’un trait homogène que le test doit mesurer. La validité de contenu, en fractionnant le concept, fait disparaître le caractère général et homogène du trait à mesurer.