Cours 5 Flashcards
(65 cards)
Qu’est-ce qu’on veut savoir, généralement, lorsqu’on évalue la validité d’un instrument de mesure?
S’il mesure vraiment ce qu’il prétend mesurer ou devrait mesurer
On veut savoir si l’échantillon d’items (i.e., les questions) de l’échelle représente bien le construit qu’on veut mesurer
Que permet de déterminer le degré de validité?
L’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle
Est-ce que le nom d’un test ou d’une échelle constitue un indice adéquat du construit mesuré?
Non, pas toujours
La vraie question n’est pas «est-ce que ce test est valide ou pas», mais quoi?
«Est-ce que ce test est une mesure valide de ce construit, pour cette population particulière et pour cette application particulière»
La validité d’un test ou d’une mesure doit être évaluée relativement à trois aspects, lesquels?
- Est-ce qu’il mesure bien le construit qu’il prétend mesurer?
- Est-ce qu’il mesure bien ce construit pour la population ciblée?
- Est-ce qu’il mesure bien ce construit pour une application particulière?
Les organisations professionnelles soulignent trois points clés à propos de la validité des tests (AERA, APA, NCME), lesquels?
- La validité concerne l’interprétation des scores procurés par un test pour un construit spécifique; ce n’est pas une caractéristique du test
- La validité est une question de degré; ce n’est pas une question absolue, de tout ou rien
- La validité d’un test repose sur de solides bases théoriques et empiriques
Quelles sont les différentes sources de validité?
Contenu
Construit:
- Factorielle
- Convergente
- Discriminante
Critère
- Concomitante
- Prédictive
- Incrémentielle
Qu’est-ce que la vraisemblance?
Aussi appelée validité d’apparance
Le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement de
A. les personnes qui sont évaluées avec le test
B. Les personnes qui utilisent le test
Est-ce que la vraisemblance est une forme ou une source de validité?
Non
Quand est-ce qu’une mesure détient une bonne vraisemblance?
Lorsque les personnes évaluées ou celles qui l’utilisent jugent qu’elle «semble pertinente et adéquate» pour mesurer le construit
Avec quoi est parfois confondue la vraisemblance?
La validité de contenu
Qu’est-ce qui peut devenir une menace à la validité?
Si l’instrument ne paraît pas valide ou vraisemblable pour les personnes évaluées/utilisatrices dans les situations concrètes d’évaluation
Plusieurs facteurs peuvent influencer la vraisemblance. Lesquels?
- Format de présentation de l’instrument
- Contexte d’évaluation
- Capacités cognitives des répondants
- Santé mentale et état psychologique des répondants
- Personnalité des répondants
- Motif de l’évaluation (désirabilité sociale + ou -)
Qu’est-ce que la validité de contenu?
Réfère au degré de représentativité des items (questions) utilisés pour mesurer un construit
Comment est-ce que la validité de contenu est-elle établie?
La plupart du temps, de façon déductive
(Les auteurs du test demandent à un groupe d’experts indépendants de se prononcer sur la pertinence des items)
On demande est-ce que:
1. Chaque item individuellement correspond bien au construit?
2. Tous les items d’une échelle considérés comme un groupe constituent un échantillon représentatif de tous les domaines (et sous-domaines) du construit d’intérêt?
Est-il facile ou difficile de faire un bon échantillonnage de contenu pour des construits psychologiques complexes?
Difficile - et ici, les méthodes statistiques ne sont d’aucune aide… ou presque
Qu’est-ce qui est central dans la validité de contenu?
La représentativité (tous les domaines et sous-domaines du construit sont-ils représentés?)
En lien avec la validité de contenu, qu’est-ce que les auteurs doivent faire avant de construire une échelle?
Doivent toujours décrire en détails et de façon compréhensive les différents domaines et sous-domaines du construit d’intérêt
À partir de quoi les chercheurs définissent-ils un construit (et donc, son contenu?)
1) Cadre théorique
2) Recherches empiriques (recension de la littérature)
3) Connaissances et expériences professionnelle/pratiques
Quels sont les deux types de validité de contenu?
- Nominale: auteurs du test
- Consensuelle: groupe de spécialistes indépendants
Comment estimer le degré de validité de contenu empiriquement?
Avec une échelle de mesure quantitative, on demande à des experts indépendants d’estimer
A. À quel point (degré) chacun des items d’un test est pertinent et représentatif du construit d’intérêt
B. À quel point (degré) l’ensemble des items constitue un bon échantillon représentatif du contenu du construit
Comment quantifier le degré de validité de contenu?
On donne aux experts un choix de réponse avec une gradation à propos de chaque item afin de systématiser le tout
Comment est-il possible de calculer un Indice de validité de contenu (IVC)?
Avec les données numériques
On calcule un indice pour chaque item (IVC-I) et pour l’échelle totale (IVC-É)
- IVC-I = Nombre d’experts qui ont jugé l’item représentatif, divisé par le nombre total d’experts
- IVC-É = Somme des IVC-I, divisée par le nombre total d’experts
Quelles sont les deux grandes menaces à la validité de contenu?
- Inclusion de contenu conceptuellement non pertinent (e.g., des items d’hyperactivité sont intégrés dans une échelle d’inattention)
- Sous-représentation conceptuelle de certains domaines du construit