Cours 4 - Traduction, développement de tests et validation de contenu Flashcards

Question 1

Q

Quels sont les trois types de biais possibles?

Answer

A

Biais de construit
Biais de méthode
Biais d’items

Question 2

Q

Qu’est-ce que le biais de construit?

Answer

A

Lorsque le construit mesuré est différent en termes de conceptualisation (par exemple, définitions différentes de l’intelligence qui inclut ou non les habiletés de communication) ou de comportements associés au construit (par exemple, être un bon enfant en Chine est plus exigeant qu’en occident). Lorsqu’on soupçonne l’existence d’une telle tendance ethnocentrique, il faut alors effectuer une enquête avec une équipe multiculturelle et multilingue ayant une expertise en regard du construit.

Question 3

Q

Qu’est-ce que le biais de méthode?

Answer

A

Réfère à la façon dont le test est administré, ce qui peut en affecter la validité. Plusieurs sources possibles incluant des différences dans : les effets de l’examinateur, la désirabilité sociale, la familiarité avec les items, la familiarité avec le format des items (choix multiples ou échelle de Likert), les situations de test en général. Une façon d’évaluer ce biais est de mesurer le construit de différentes manières (triangulation de la mesure) ou d’utiliser une mesure répétée. On peut aussi mesurer la désirabilité sociale ou administrer le test d’une façon non standard.

Question 4

Q

Qu’est-ce que le biais d’items?

Answer

A

Inclut la faiblesse de la langue, le contenu inapproprié des items et la traduction inadéquate. Les items sont biaisés si deux groupes ayant le même score global ont des résultats attendus différents aux items. Pour des items dichotomiques, une façon d’évaluer ce biais est le test de Mantel-Haenszel. Pour des items à intervalles, on peut utiliser des analyses de variance où les groupes et les scores globaux sont les variables indépendantes et le résultat à l’item est la variable dépendante.

Question 5

Q

Lorsqu’on assume qu’il n’y a qu’une possibilité de biais d’items, une traduction littérale peut être utilisée. Qu’est-ce que la traduction littérale?

Answer

A

Il s’agit alors de faire la traduction et une « back translation » que l’on compare. Après une possible révision, le test est administré aux groupes source et cible et les résultats sont comparés.

Question 6

Q

Quelles sont les possibilités face à un biais de construit ou un biais de méthode?

Answer

A

Adapter le test de différentes façons :

adaptation des items
adaptation du format des items
entraînement de l’examinateur
emploie de la triangulation.

Lorsqu’on voudra par la suite comparer l’ancien test au nouveau, il faudra utiliser une analyse factorielle confirmatoire.

Question 7

Q

Les changements les plus radicaux sont habituellement reliés à quel type de biais?

Answer

A

Au biais de construit où l’on doit parfois éliminer complètement un ou des items. Si ce biais est trop fort, il vaut mieux procéder à la création d’un nouveau test que d’en traduire un. L’intérêt n’est pas alors de comparer les scores dans les deux groupes, mais de s’assurer que le même construit est mesuré, ce qui peut se faire en utilisant des analyses de régression.

Question 8

Q

Quelles sont les cinq étapes d’élaboration d’un test?

Answer

A

La détermination des utilisations prévues du test
La définition de ce que l’on souhaite mesurer
La création des items
L’évaluation des items
La détermination des propriétés métriques du test définitif

Question 9

Q

Qu’est-ce que la détermination des utilisations prévues du test?

Answer

A

Les usages prévisibles d’un test déterminent grandement ses caractéristiques.

Quels sont les buts du test ? Par exemple, servira-t-il principalement à sélectionner les meilleurs sujets dans un groupe ou servira-t-il principalement à évaluer si un individu maîtrise les compétences attendues en fin d’année scolaire? Dans le premier cas, il s’agira d’un test normé et dans le second d’un test critérié, ce qui conditionnera la méthodologie de construction utilisée.

À quelle clientèle est-il destiné ? Est-ce que le test sera utilisé auprès de la population en général ou avec des populations spécifiques telles que seulement des enfants, ou seulement des adultes, ou seulement des déficients mentaux, etc. ?

Question 10

Q

Qu’est-ce que la définition de ce que l’on souhaite mesurer?

Answer

A

Habituellement, le point de départ d’un test est un objectif relativement vague et général (par exemple, diagnostiquer les troubles d’attention ou sélectionner des secrétaires) qu’il faut opérationnaliser. Il faut donc déterminer soit la portée de la construction mentale (attention) ou l’étendue du domaine mesuré (compétences d’une bonne secrétaire).

L’élaboration du plan de la structure du test sera guidée soit par la théorie dans le cas de la mesure d’un construit mental ou soit par une analyse de contenu de domaine de comportements ou des exigences d’emploi dans le cas de la mesure d’un domaine de comportements.

Question 11

Q

Qu’est-ce que la création des items?

Answer

A

Il faut tout d’abord choisir le format des items (par exemple, questions fermées ou ouvertes) en fonction des objectifs du test et des conditions de création, de passation et de cotation.

On détermine par la suite le niveau de difficulté des items en fonction des objectifs du test et en fonction du type de test (par exemple, normé ou critérié).

Enfin, on décide du nombre d’items à créer en fonction de la durée du test et en fonction du niveau de fidélité recherché. Il est à noter qu’il faut prévoir entre 30 à 50% plus d’items que ce que l’on désire, car on éliminera des items lors de la mise à l’essai. On passe alors à la rédaction des items.

Question 12

Q

Qu’est-ce que l’évaluation des items?

Answer

A

Les items sont évalués de deux façons, d’abord par des juges, puis par une mise à l’essai des items.
Les juges apprécient la conformité des items aux exigences définies lors de la seconde étape, i.e. suite à la définition opérationnelle de ce que l’on souhaite mesurer.
La mise à l’essai consiste à faire passer tous les items à un échantillon restreint de la population. Les résultats sont ensuite analysés de façons qualitative et quantitative (niveau de difficulté, pouvoir discriminant) afin de sélectionner les meilleurs items qui serviront à construire la version définitive du test.

Question 13

Q

Qu’est-ce que la détermination des propriétés métriques du test définitif?

Answer

A

Les propriétés métriques, qui seront rapportées dans un manuel accompagnant le test, sont déterminées suite à la passation du test à un échantillon normatif.
Il faut tout d’abord établir des normes (pour un test normé) ou des scores de référence (pour un test critérié).

Il faut par la suite faire des analyses de fidélité et de validité.

Question 14

Q

Qu’est-ce que la validité de contenu?

Answer

A

La validation de contenu est une méthode qui consiste à analyser le contenu du test afin de s’assurer qu’il est représentatif en tant qu’échantillon du domaine de comportements à mesurer.

Question 15

Q

Quelles sont les deux questions à se poser par rapport à la validité et la représentativité?

Answer

A

À quel point chaque item ou question qui forme le test appartient à l’univers du construit défini?
À quel point l’ensemble des items ou des questions représente tous les aspects de cet univers?

Question 16

Q

Quelle est la seule façon de juger la représentativité du test?

Answer

Study These Flashcards

A

Par rapport à la définition donnée au construit mesuré.

Question 17

Q

Quelle est la différence entre la validité apparante et la validité de contenu?

Answer

Study These Flashcards

A

La validité apparente correspond à ce que le test semble mesurer, i.e. est-ce que le test semble valide aux yeux des examinés, du personnel administratif, des observateurs non- initiés, etc.

Ceci est donc différent de la question de ce que le test mesure de fait. On peut augmenter la validité apparente en modifiant quelque peu les questions afin qu’elles paraissent plus pertinentes aux examinés.

Question 18

Q

Quelles sont les étapes de la procédure de validation de contenu?

Answer

Study These Flashcards

A

La détermination des utilisations prévues du test
La définition de ce que l’on souhaite mesurer
La création des items
L’évaluation des items

Question 19

Q

La création des items dans la validation de contenu est différente la création d’item durant l’élaboration d’un test. Quelles sont les différences?

Answer

Study These Flashcards

A

Lorsqu’on a déterminé le format, le niveau de difficulté et le nombre d’items à créer « devis de rédaction », on passe alors à la première rédaction en s’aidant d’une « table croisée de spécification ».

Par exemple, pour un test final d’un cours d’introduction à la psychométrie, on pourrait avoir le tableau suivant qui donne la répartition du nombre de questions selon les champs de contenu et les objectifs d’apprentissage. Un tel tableau rend plus explicite la rédaction du test.

Par la suite, on rédige les items pour chaque catégorie de la table (correspondant à chaque aspect important du domaine ou de la tâche), ce qui crée la banque initiale d’items.

Ensuite, on détermine la structure du test : Ordre (séquentielle et logique) des items dans le test (par exemple difficulté croissante); Organisation en sous-tests distincts ou mélange des items

Question 20

Q

Quel élément pertinent du domaine d’application de la validation de contenu est important de mentionner?

Answer

Study These Flashcards

A

La validation de contenu est une méthode qui ne s’applique pas aussi aisément à tous les types de tests psychologiques.

Question 21

Q

La validation de contenu s’applique bien aux…

Answer

Study These Flashcards

A

Tests de rendement typique ou optimal, occupationnel ou scolaire.

Dans ce dernier cas, on parle alors de validité didactique pour savoir si le contenu d’un test a bien été couvert dans un programme pédagogique.

Tests de sélection et de classification

Question 22

Q

La validation de contenu s’applique plus difficilement aux…

Answer

Study These Flashcards

A

Tests de personnalité et d’aptitudes, puisque:
Relation plus lointaine entre les items du test et les caractéristiques mesurées traditionnellement dans ces tests
Conception des aptitudes et de la personnalité comme des traits plutôt que comme des performances situationnelles
Les théories à la base de ces tests supposent l’existence d’un trait homogène que le test doit mesurer. La validité de contenu, en fractionnant le concept, fait disparaître le caractère général et homogène du trait à mesurer.

Cours 4 - Traduction, développement de tests et validation de contenu Flashcards

(22 cards)