cours 5 - PARTIE 1 Flashcards
(38 cards)
Pourquoi évaluer la validité d’un instrument de mesure?
on veut généralement savoir s’il mesure vraiment ce qu’il prétend ou devrait mesurer
Quelle est la fonction du degré de validité?
Il détermine l’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle
Est-ce que le nom d’un test ou d’une échelle constitue toujours un indice adéquat du construit mesuré?
NON
Quels sont les trois éléments à considérer lorsque l’on questionne la validité d’un test ou d’une mesure? (CPA)
- Est-ce qu’il mesure bien le CONSTRUIT qu’il prétend mesurer ?
- Est-ce qu’il mesure bien ce construit pour la POPULATION CIBLÉE (ex: groupe d’âge, niveau académique, groupe clinique particulier, etc.) ?
- Est-ce qu’il mesure bien ce construit pour une APPLICATION PARTICULIÈRE (ex: classifier dans des groupes diagnostiques, donner une valeur quantitative sur continuum, etc.) ?
Quelles-sont les trois organisation professionnelles qui soulignent des points clés quant à la validité des tests? (PAS SURE SI C’EST IMPORTANT, DIAPO 6?) i dont think so gurl
- AERA (American Educational Research Association)
- APA (American Psychological Association)
- NCME (National Council On Measurement In Education)
Nomme les trois points clés à propos de la validité des tests? (SDB)
- La validité concerne interprétation des SCORES PROCURÉS PAR UN TEST pour un construit spécifique; ce n’est pas une caractéristique du test
- La validité est une question de DEGRÉ ; ce n’est pas une question absolue, de «tout ou rien»
- La validité d’un test repose sur de solides BASES THÉORIQUES ET EMPIRIQUES
Nomme les trois sources de validité. (CCC)
- Contenu
- Construit (factorielle, convergente, dominante)
- Critère (concomitante, prédictive, incrémentielle)
Qu’est-ce que la vraisemblance (aussi appelé validité d’apparence)?
Le degré auquel une mesure SEMBLE ADÉQUATE et reliée à un construit spécifique selon le jugement:
- Des personnes QUI SONT ÉVALUÉS avec le test (ex: clients, profanes, non-experts qui sont évalués)
- Et/ou les personnes QUI UTILISENT le test
(ex: intervenants, mais peut aussi être des représentants légaux reliés à la population ciblée, etc., par ex. parents, enseignants, etc.)
Une mesure détient une bonne vraisemblance lorsque…
Les personnes évaluées ou celles qui l’utilisent jugent qu’elle «semble pertinente et adéquate» pour mesurer le construit
Nomme trois facteurs pouvant influencer la vraisemblance. (FCC)
- Format de présentation de l’instrument
- Contexte d’évaluation (ex: endroit physique de l’administration, les consignes, attitude et apparence physique de l’évaluateur etc.)
- Capacités cognitives des répondants
Qu’est-ce que la validité de CONTENU
- Réfère au degré de REPRÉSENTATIVITÉ DES ITEMS (questions) utilisés pour mesurer un construit
- La plupart du temps établie de façon DÉDUCTIVE (les auteurs du test demandent à un groupe d’experts indépendants de se prononcer sur la pertinence des items)
Quelles-sont les deux questionnements à explorer pour la validité de contenu?
Est-ce que chaque item individuellement correspond bien au construit ?
Est-ce que tous les items d’une échelle considérés comme un groupe constituent un ÉCHANTILLON REPRÉSENTATIF de tous les domaines (et sous-domaines) du construit d’intérêt ?
Quel concept est central dans la validité de contenu?
La REPRÉSENTATIVITÉ : Est-ce que tous les DOMAINES (et SOUS-DOMAINES) du construit sont représentés ?
ex: Pour une échelle d’impulsivité: impulsivité cognitive, impulsivité émotionnelle, impulsivité comportementale, etc.
À partir de quoi les chercheurs définissent un construit et donc, son contenu? (CRC)
- Cadre théorique
- Recherches empiriques (recension)
- Connaissances et expériences professionnelles/pratiques
Quelles-sont les deux types de validité de contenu? (NC)
Nominale : auteurs du test
Consensuelle : groupe de spécialistes indépendants
Comment estimer le degré de validité de contenu empiriquement?
Avec une échelle de mesure quantitative, on demande à des EXPERTS INDÉPENDANTS d’estimer:
- à quel point (degré) chacun des items d’un test est PERTINENT ET REPRÉSENTATIF du construit d’intérêt
- à quel point (degré) l’ensemble des items constitue un BON ÉCHANTILLON REPRÉSENTATIF du contenu du construit
Comment quantifier le degré de validité de contenu?
On donne aux experts un choix de réponse avec une gradation à propos de chaque item afin de systématiser le tout
(ex: Pas du tout pertinent / représentatif = 0
Un peu pertinent / représentatif = 1
Assez pertinent / représentatif = 2
Très pertinent / représentatif = 3)
Comment calculer l’indice de validité de contenu pour chaque ITEM (IVC-I)?
IVC-I = Nombre d’experts qui ont jugé l’item représentatif (choix 2 ou 3) divisé par le nombre total d’experts
Comment calculer l’indice de validité pour l’ÉCHELLE TOTALE (IVC-É)?
IVC-É = Proportion d’items jugés représentatifs (choix 2 ou 3) – ou dit autrement, la moyenne des IVC-I – divisée par le nombre total d’experts
Quelles-sont les deux grandes menaces à la validité de contenu? (IS)
- Inclusion de contenu conceptuellement non pertinent
- Sous-représentation conceptuelle de certains domaines du construit
(Voir diapo 18 pour exemples)
Défini la validité de CONSTRUIT.
Réfère au degré de
(a) reproductibilité de la structure interne théorique sous-jacente à l’instrument
(b) relations du construit d’intérêt avec d’autres construits externes
Quelles sont les deux grandes façons de la vérifier la validité de CONSTRUIT?
- Validité factorielle
- Validité convergente / discriminante
Qu’est-ce que le réseau nomologique?
Théorie expliquant le construit par le biais de ses interrelations avec d’autres construits (Cronbach & Meehl, 1955)
Voir diapo 22-23 pour exemple de réseau nomologique
Définis “nomologie”.
L’étude des lois