Cours 6 à 12 Flashcards

(107 cards)

1
Q

En méthode quantitative, 3 méthode de collecte de données

A
  • Données officielles
  • Sondages de victimisation (trouver des victimes, pas le nombre de crimes)
  • Données auto-révélées
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Avantages et inconvénients de la méthodes de collecte de données quantitatives

A

Avantages:
- Quantité d’informations (très grande)
- Plusieurs hypothèses (peut en tester plrs)
-Rapide (questions avec choix faciles)
- Comparable (tous on les mêmes questions)
- Coût

Inconvénients:
- Déformation des propos (interprétation différente des questions)
- Inaptitude à répondre (répondre au hasard)
- Informations sommaires (pas possible d’investiguer les réponses et les adapter d’une personne à une autre)
- Chiffre noir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Exemple du chiffre noir en criminologie

A

Si les délinquants ne sont pas arrêtés, ils ne seront pas dans les chiffres, même si ce sont des criminels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Chiffre noir

Qu’est-ce qui affecte la reportabilité

A

Plus le délit est grave, moins il va être reporté (ex: vol = 62% et AS = 9%)

  • Nature du crime
  • gravité des délits
  • proximité relationnelle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

3 niveau du chiffre noir, de officiellement reporté à inconnu

A
  1. données officielles
  2. données de victimisation
  3. données auto-révélées
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

2 types de données officielles et description

A

Données unitaires: vise une personne en particulier, pourrait avoir le nom du participant

Données agrégées: regroupé en quartier, groupes sociaux… anonyme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Avantages et inconvénient des données officielles

A

Avantages:
- Coût
- Accès
- Études extensives et évolutives
- Standardisation (facilement comparable entre les pays)

Inconvénients:
- Chiffre noir
- Problème d’incidence (peu avoir commis plus d’un délits, commettre 2 meutres sur les 4 recenssés)
- Problème de classement (délit officiel n’est pas toujours le délit réel)
- Utilité limitée pour … (macro: canada, micro: individuel)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

But des sondages de victimisation

A

ESG: Enquête sociale générale

Q : est-ce que les personnes ont été victimes d’un crime au cours d’une période donnée?

Demander un recenssement des victimes pour réduire le chiffre noir en recessant ceux qui n’ont pas été reportés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Avantages et inconvénient sondages de victimisation

A

Avantages:
- Chiffre noir
- Ne dépendent pas du SJP (syst. justice pénal)
- Caractéristiques des victimes
- Conséquences de la victimisation

Inconvénient:
- Informations partielles (pas d’info sur le criminel)
- Certains types de délits pas abordés (ne prend pas en compte les crimes sans victimes)
- Localisation temporelle (quand le crime a été fait)
- Interprétations personnelles
- Comparaison difficile (entre les pays et les personnes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment sont récupérées les données auto-révélées

A

Questionnaires standardisés, qui sont des test de personalités et validé empiriquement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Avantages et inconvénients des données auto-révélées

A

Avatages:
- Chiffre noir
- Facteurs de risque et de protection (faire des lien ex: impulsivité et criminalité)
- Très grands échantillons
- Analyse indépendante du SJP (ne sont pas dans les données officiellles)
- Méthode valide (questionnaire standardisé)
- Coût
- Anonymat (cherche la tendance et non des personnes en particuliers

Inconvénents:
- Pas la population fortement criminalisée
- Intrusion du chercheur (lui qui choisi les questions et les thème, impose son choix de questions)
- Attention aux mauvaises formulations (variation des interprétations)
- Ne prend pas en compte la complexité (ne pas venir chercher en profondeur les réponses)
- Amplification ou minimisation
- Localiser dans le temps
- Interprétations personnelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

4 types de méthode de collecte de données qualitative

A
  • observations
  • entrevues
  • analyse documentaire
  • groupe de discussion (focus group) - entrevue en groupe sur un sujet/thématique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Concept, dimension, but

A

Concept: représentation mentale, générale et abstraite d’un ou de plusieurs phénomènes
Lorsqu’il est trop large, il faut le diviser en dimensions
Capacité de le mesurer

**But **: faire preuve de parcimonie (simplification) tout en optimisant notre capacité à expliquer ce que l’on veut expliquer

Ex: Concept = psychopathie
DImensions = détachement émo, antisocial, manipulation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

définir Définition conceptuelle et exemple

A

Lorsque l’on a réussi à identifier notre concept et ses dimensions (et sous-dimensions), on peut alors créer une définition conceptuelle
Définir tous les aspects autour desquels s’articulent le concept

Ex: prolème d’argent (concept), arrive quand il y a plusieurs dettes et peu de revenu (dimensions)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment élaborer sa définition conceptuelle

A

Commencer avec sa propre définition (intuition, expériences, observations, etc.)

On précise en faisant une recension des écrits : comment le concept est-il défini par les autres ?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qualités d’une bonne définition conceptuelle (4)

A
  • clarté
  • précision
  • concision
  • exactitude
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Risques liés à une mauvaise conceptualisation :

A

Biais dans les résultats
Influence sur la pratique
Influence sur l’opérationnalisation (mal mesuré)
ex: les incels veulent un relation, mais en n’ont pas. Trop de gens peuvent entrer dans cette catégorie, mais ne sont pas tous misogyne. Le terme incel est donc mal défini ce qui peut apporter un biais dans les résultats et en apporter de mauvais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Opérationnalisation et son but

A

façon dont on organise et mesure nos concepts/variables pour passer de l’abstrait au concret. Pour convertir une idée en une mesure.
Comment le concept et ses dimensions peuvent-ils s’observer dans la réalité?

Obj:
Écrire des questions qui se retrouveraient dans un sondage
Définir des énoncés précis qui pourraient être intégrés dans un instrument de mesure

L’opérationnalisation joue un grand rôle dans la validité de l’instrument parce qu’on réfère à l’exactitude de la mesure afin d’évaluer un concept

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Conceptualisation à l’opérationnalisation (en ordre)

A
  1. Cencept latent (Nommer les multiples sens associés au concept)
  2. Dimension (Dégager les dimensions pertinentes)
  3. indicateurs (Définir les indicateurs (les questions à poser)) – opérationnalisation

Ex: psychopathie – charme, manipulation – Question PCL-R

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Définition conceptuelle vs définition opérationnlle

A

Conceptuelle: fait référence à la signification abstraite et théorique d’un concept (ex: définition textuelle)

opérationnelle: fait référence à la manière dont les variables sont mesurées ou à l’instrument utilisé (ex: questions PCL-R)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

3 types d’indicateurs et exemples

A

Les comportements
ex: Actions des participants, formes de crimes

Les opinions, les intentions, les attitudes
ex: Idées sur un sujet, perceptions

Les conditions objectives d’existence
ex: Genre, salaire, âge, caractéristiques d’un quartier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

définition d’une variable

A

indicateur qui varie et auquel des **valeurs sont assignées **

Une variable peut indiquer des degrés, des quantités, des différences
Précise de quelles façons les indicateurs seront codifiés
Les indicateurs deviennent alors des variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Comment peut-on utiliser les statistiques et pourquoi sont-elles utiles

A

La statistique est un langage avec ses règles, ses termes et ses expressions (sont un outil)

elles permettent de répondre à des questions de recherches

permet de rendre le monde clair et compréhensible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Objectifs des statistiques

A

Objectifs :
Répondre le moins imparfaitement possible
Repérer les réponses les plus imparfaites

Les données que l’on veut mesurer vont être mesuré de manière imparfaie. On essaie de se rapprocher de la vrai mesure, mais c’est impossible de l’Atteindre. Les statistiques vont nous permettre de répondre un peu moins imparfaitement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Comment trouver une bonne variable
indicateur auquel des **valeurs sont assignées** Degrés, quantités, différences, etc. Précise de quelle façon les indicateurs seront codifiés Les indicateurs deviennent alors des variables Une variable n’est **pas nécessairement la réponse à une question d’un questionnaire**. Elle peut **aussi être un calcul** Exemple : le ratio mensuel du nombre de voies de faits commis à Montréal / 100 000 habitants
25
Noms des 3 types de variables (sans décire)
Nominale / catégorielle Ordinale Continue (intervalle ou ratio)
26
Description d'une variable nominale
Séparé en catégories plusieurs possible (**dichotomique** ou **polytomique**) Il n'y a pas de valeur qui a plus d'importance qu'une autre PAS d'opérations mathématiques, sauf si c'est pour une analyse descriptive (ex: fréquences)
27
Qu'est-ce qu'une variable ordinale
Échelle qui va impliquer un rang (un peu, moyen, bcp, énormément) Certaines valeurs vont avoir plus de force que d'autres La distance entre chacune des valuers n'est pas toujours égale (dépend de l'imterprétation)
28
Qu'est-ce qu'une variable continue
Peut les mettre en ordre avec des chiffres et la distance entre chaque valeurs est égale (valeurs réelles) **Intervalle**: n'a pas de 0 absolu où le 0 ne signifie PAS l'absence du phénomène (ex: température) **Ratio**: 0 signifie une absence du phénomène (ex: nombre de crime)
29
Exemple d'une variable qui change de forme
Quel âge avez-vous? (variable continue) À quelle catégorie d'âge entre jeune et âgé (variable nominale) Quel âge entre 0-5, 6-10, 11-15, etc... (Variable ordinale)
30
Qu'est-ce que l'analyse univariées
relative à une variable : distributions de fréquences une seule variable est regardé = analyse descriptive
31
À quoi sert les tableaux de fréquences
- Prendre connaissance des données (donner une première idée) - Voir la distribution des variables à travers l’échantillon - Détecter les problèmes : --Valeurs manquantes (pas répondu) --Données aberrantes (répondu n'importe quoi) --Catégories devant être retravaillées - Évaluer les possibilités d’analyse
32
Buts de l'analyse univarié
- Étape préliminaire - Idée générale de la nature des variables - Orienter les analyses subséquentes - Lorsqu’on a un problème, la solution se trouve souvent lors de l’étape des analyses descriptives… (va permettre de savoir quel est le type d'une variable)
33
3 aspects de l'analyse univariée
- mesure de tendance centrale - mesures de dispersion - distribution des résultats (variables continues)
34
Qu'est-ce que contient les mesures de tendance centrale et à quoi ça sert
Utilité: - Indiquent où se trouve la majeure partie des données - Score typique (moyenne de groupe) - Effort de synthèse Contient: - mode - médiane - moyenne
34
# Mesures de tendance centrale Mode
Valeur la plus fréquente d’un ensemble de données Pour variables NOMINALES, ORDINALES et CONTINUES Rarement employé seul
35
# Mesures de tendance centrale Médiane
Observation du milieu 2 3 3 4 4 ***4*** 4 4 4 5 5 Pour variable ORDINALE et CONTINUE
36
# Mesures de tendance centrale Moyenne
Mesure de tendance centrale la plus courante où X est une valeur numérique réelle Pour variable CONTINUE seulement
37
# Mesures de dispersion Pourquoi avons-nous besoin de mesures de dispersion et qu'elles sont les 3 utilisées
Les mesures de tendance centrale ne suffisent pas Étalement des valeurs autour d’une valeur centrale Étendue Variance Écart-type
38
# Mesures de dispersion Comment mesurer l'étendue
Max - min = étendue
39
# Mesures de dispersion But de la variance et comment la mesurer
Dispersion de chaque observation **autour de la moyenne** (Somme(Chaque valeur – la moyenne)^2)/(n-1) (éviter les conflits entre valeurs négatives et positives) | petite variance, donc plus près de a moyenne
40
Comment mesurer l'écart-type et son interprétation
Racine carrée de la variance. 68,2% des résultats sont compris entre -1 et +1 ET 95,4% des résultats sont compris entre -2 et +2 ET 99,6% des résultats sont compris entre -3 et +3 ET Un grand écart-type va avoir des données étalées La moyenne est ligne centrale qui sépare en 2
41
Qu'est-ce que la loi normale
Moyenne, médiane et mode sont au même point et les données sont également réparties de chaque côté de la normale. Pour variable CONTINUES NORMALE et ORDINALE vont utiliser des histogrammes
42
Kurtose des distribution (3)
Indice d'aplatissement, étalement par rapport à la moyenne (tous par rapport à la loi normale (distribution normale)) - Distribution leptocurtique (haute et mince) - Distribution normale - Distribution platicurtique (basse et large)
43
Symétrie des distributions
indice de symétrie **Right skewed / asymétrie positive** : La majorité des données à gauche, diminue à droite **Left skewed / asymétrie négative** : la majorité des données sont à droite, diminue à gauche
44
Qu'est-ce que la valeur latente et comment on la mesure
Va être mesuré avec des indicateurs (valeurs observables) Valeur observable=valeur latente+erreur
45
Comment diminuer l'erreur associé à la mesure
construction d’une échelle de mesure composite - On regroupe plusieurs indicateurs (questions) - On obtient ainsi une variance plus juste et réelle
46
Problèmes de variance d’une mesure (3)
Peu d’observations pour mesurer un phénomène Peu de choix de réponse (dichotomique vs continue) Tout le monde répond la même chose (ex : sadisme) (ne permet pas une bonne diversité de score)
47
C'est quoi mesurer la **fidélité et la validité** + erreur de mesure
Mesurer : opération qui consiste à **assigner des nombres** à des objets, à des événements ou à des situations **selon certaines règles**. Passer du construit théorique à une expression quantifiable / mesurable Erreur de mesure : **différence** entre la mesure réelle **(score vrai)** et celle qui est prise à l’aide d’un instrument de mesure **(score observé)**
48
C'Est quoi un instrument de psychométrie et son objectf
Instrument psychométrique : Outil **développé scientifiquement** qui permet de **mesurer un concept latent** de manière objective et **standardisée** Peut prendre plusieurs formes Objectif : la mesure la moins imparfaite possible, **diminuer au maximum l’erreur**
49
Trois critères pour qualifier un outil psychométrique
1. **Standardisation** : uniformité de la démarche d’administration et de correction des réponses 2. **Objectivité** : les résultats obtenus ne résultent pas d’une évaluation subjective 3. **Propriétés psychométriques** : fidélité et validité
50
Pq important de respecter la fidélité et la validité (2)
Respecter la fidélité et la validité permet de se f**ier aux données recueillies** et de **tirer des conclusions plausibles** à partir des résultats obtenus Les professionnels prennent des décisions importantes et **analysent des situations délicates** Exemple : relâcher un criminel dangereux
51
Définition de la fidélité et de la validité
Fidélité : **précision et stabilité** de la mesure Ce que nous mesurons est-il mesuré sans erreur ? quelle est la précision de la mesure ? quelle est la constance de la mesure ? **Résultats constants** Validité : **représentativité **de la mesure
52
définition de stabilité temporelle et technique
Stabilité temporelle : **constance sur le plan temporel** des **mesures répétées** prises auprès d’un **même groupe** de participants Technique : **Test et re-test** avec un délai de **2 à 4 semaines** entre les deux passations Coefficient de corrélation (r) entre les résultats obtenus aux deux passations (0,7 et 0,9)
53
Équivalence – formes parallèles et technique
: **fidélité** entre **deux versions équivalentes** d’un instrument de mesure Technique : **Coefficient de corrélation** entre les 2 versions d’un même instrument de mesure (0,7 et 0,8)
54
Équivalence – accord inter-juges et technique et corrélation
degré auquel **deux observateurs (ou plus)** obtiennent les **mêmes résultats **sur le même événement observé Technique : Pourcentage de concordance entre les observateurs Sujets c**lassés dans les mêmes catégories** (kappa > 80% suffisant) Corrélation entre les résultats fournis pour chaque énoncé Corrélation intraclasse > 75% suffisant
55
Cohérence ou consistance interne et technique et fidélité
degré d’**homogénéité des énoncés** d’un instrument de mesure. C’est le lien de chaque énoncé avec le total de l’échelle Technique : **Coefficient alpha de Cronbach** Bonne fidélité : - Alpha de Cronbach > 0,70 est une bonne consistance interne - Les indicateurs corrélés négativement ou qui font baisse l’alpha sous 0,70 sont retirés de l’échelle
56
Nommez les 3 types de validité et les sous-types
Validité de contenu Validité de construit Validité convergente Validité discriminante Validité de critère Validité concomitante Validité prédictive
57
Validité de contenu, technique et bonne validité
Validité de contenu : indique que les **énoncés qui déterminent le contenu sont représentatifs** du ou des construits mesurés et de leurs différentes facettes (dimensions) Technique : décision **subjective** (réévaluation périodiquement), pas de test précis pour évaluer la validité de contenu. Elle s’évalue par une **accumulation d’évidences**, on s’appuie sur la littérature --> **conceptualisation** Bonne validité : Les items doivent **couvrir tous les aspects principaux** du concept mesuré Les items doivent** couvrir** ces différents aspects de **manière proportionnelle** L’instrument ne doit **pas **contenir d**’items non-pertinents** ## Footnote estimation de la représentativité d'une mesure pour chaque élément d'une mise en situation
58
Validité de construit - convergente, technique
Validité de construit – validité convergente : indique que **2 mesures** censées **refléter le même construit** produiront des **résultats similaires** Technique : Coefficient de corrélation (r) ## Footnote Cependant la validité convergente, ne suffit pas, il faut vérifier la validité discriminante.
59
validité de construit - discriminante, technique et validité
Validité de construit – validité discriminante : Désigne la **capacité de l’instrument** à établir une d**istinction entre des groupes** dont la **différence est connue** Technique : Test de comparaison de moyennes Bonne validité : Test significatif ## Footnote Besoin d'une bonne validité convergente et discriminante, sinon ne peut pas être utilisé
60
validité de critère - concomitante, technique
Validité de critère – validité concomitante : Établit la **validité d’un nouvel instrument** de mesure pris simultanément **avec** une **mesure reconnue comme valide** (mesure avec test référentiel) bon si haute correlation Technique : Coefficient de **corrélation entre deux instruments** de mesure représentant un même concept (à un seul temps de mesure)
61
validité de critère - prédictive, tecnique
Validité de critère – validité prédictive : Détermine **si le résultat actuel**, obtenu à l’aide d’un instrument, peut être **utilisé pour prédire un résultat ultérieur** Technique : **Coefficient de corrélation** entre une mesure d’un concept au **temps 1 et au temps 2** (période plus grande que le test-retest), ou entre la mesure d’un concept et un autre qui lui est intimement lié. Prédiction des aptitudes
62
# validité de critère - prédictive évaluation rétrospective vs prospective
Évaluation **rétro**spective : Le comportement que l’on **veut prédire est déjà connu** (ex. : le délinquant en libération conditionnelle a-t-il récidivé oui ou non?) On remplit l’instrument d’évaluation pour voir si les résultats **concordent avec le comportement déjà observé** Évaluation **pro**spective : Le comportement qu’on veut **prédire n’est pas connu** (ex. : le délinquant en libération conditionnelle récidivera-t-il oui ou non?) **Faire passer **l’instrument dans un **1er temps**. Après un certain temps, **évaluer si nos prédictions étaient bonnes** (mesure réelle de la récidive)
63
comment vérifier la validité
Validité = acquisition de connaissances + compréhension de la nature du phénomène
64
3 éléments de la triangulation
Plusieurs sources de données Plusieurs méthodes de collecte de données Plusieurs méthodes d’analyse de données
65
objectif de la création d'échelle
concevoir des échelles qui **mesurent mieux nos concepts que des variables seules** **limiter l’erreur de mesure** et donc une façon de le faire est de construire des échelles l’**alpha de Cronbach** permet de vérifier la qualité des échelles.
66
description de l'alpha de cronbach (définition et ce que ça fait)
mesure de la consistance interne d’un ensemble d’items formant une mesure présuppose que les mesures du phénomène vont toutes dans le même sens ## Footnote permet de vérifier que les questions (indicateurs) que l’on a rassemblées permettent effectivement de mesurer des choses similaires.
67
# Alpha de Cronbach Comment l'alpha peut être utilisé (3) | Comment savoir si la mesure est bonne
Utilisation : variables continues de type intervalle ou ratio ; échelles ordinales Attention : toutes les variables contenues dans l’échelle doivent être de même nature ! On retient les items qui sont une forte corrélation avec le total Améliore la consistance interne L’alpha est une mesure qui est influencée par le nombre d’items | entre 0 et 1, 1 étant sus ## Footnote comment chaque question corrèle avec le score total de l’échelle. C’est ce qui va nous donner une indication sur quelles questions sont les plus pertinentes pour mesurer le concept total. (SPSS)
68
Dans la colonne ''Alpha if item is deleted '' et si l’alpha obtenu est 0.75, comment décidera-t-on de supprimer un item
Si on voit que l’alpha obtenu est le plus élevé on reste comme ça (rien n'est plus haut que 0,75 si un item est retiré) Si on voit que l’alpha serait meilleur en supprimant un item, on refait l’analyse en supprimant l’item pour vérifier (l'alapha de plus de 0,75 si l'item est retiré) Aussi si ''corrected item - total correlation'' est négative = retirer l'item ## Footnote Objectif est de garder un alphaC identique ou supérieur (qui se rapproche de 1)
69
# Variable dichotomique l'alphaC peut seulement être utilisé pour des valeurs ordinales et continues. Comment procéder pour des variables dichotomique
nom différent : le KR-20 Identifier les variables dichotomiques Faire des fréquences pour s’assurer qu’elles sont bien dichotomiques Calculer l’alpha de Cronbach mais on va l’appeler KR-20 Créer l’échelle en additionnant les variables avec SPSS
70
Ce qu'il faut s'assurer d'avoir pour faire des échelles
Identifier les concepts que l’on veut mesurer, les dimensions, les indicateurs Est-ce que ces variables sont toutes du **même type** (continues, ordinales, dichotomiques) ? Est-ce qu’elles varient toutes dans le **même sens** ? Est-ce que les échelles (ordinales) **sont similaires** ? Si non, les rendre similaires (1 vaut faible pour tous, 5 vaut fort pour tous, tous avec la même unité de mesure (m, cm)) Alpha de Cronbach (ou KR-20 pour variables dichotomies) sur SPSS - Éliminer les variables corrélées négativement (avant dernière colonne avec un - ) - Éliminer les variables qui font baisser l’alpha
71
Qu’est-ce qu’une analyse bivariée
2 variables (multivarié = +2) Nominale, ordinale, continue
72
exemples Pourquoi consommation de drogues et crime violent ne sont pas suffisant comme variable
Consommation de drogue et crime violent ne **peuvent pas être catégorisé** comme nominale, continue, ordinale pour savoir comment les mesurer ex: Consommé et non consommé (nominale, dichotomique), Quelle drogue (nominale, polytomique), quel niveau Quelle crime (nominale), degré de violence (ordinale)
73
Conséquence de postulats non respectés
conclusions peu valides
74
3 étapes de l'analyse des résultats
La **signification** : Existe-t-il une relation statistiquement significative entre les deux variables ? La **force **de la relation : Ce lien est-il important ? Le **sens** de la relation : Que veut dire ce lien en termes concrets?
75
# SIGNIFICATION Comment mesurer si la relation observée attribuable à la chance?
p-value moins de 0.05 (5%) = seuil de tolérance | Si dûe au hasard, changer de type d'analyse ## Footnote Signification: est-ce que c’est statistiquement significatif / relation réelle entre les deux, ou hasard
76
# SIGNIFICATION à quoi sert le seuil de tolérance ''p''
Seuil minimal **Probabilité de se tromper** en affirmant qu’il existe un lien entre les variables. **Rejet de H0** (hypothèse nulle) Indique qu’il existe un lien/ une différence significative entre les variables **Dépend du nombre de participants** p ≤ 0,05 : nous avons **moins de 5 chances sur 100 de nous tromper** en affirmant qu’il existe une relation significative | Si peu de participant, besoin de grande différence pour que ça paraisse
77
# FORCE qu'est ce qui établit si la différence est attribuable à la taille de l’échantillon ou non.
la **force** de la relation | près de 1 = fort criminologie = max 0.8
78
# FORCE Ce qui est important à savoir pour la force
**Différent** pour** chaque test** statistique Dépend du **domaine d’étude** Coefficient de plus de 0,80 indique la colinéarité (risque de mesurer la même chose = près de 1)
79
# SENS qu'Est-ce qui permet la transcription en mots concrets de la relation entre les variables
Sens de la relation ## Footnote Si significativité est forte, permet de savoir la relation entre les 2 variables, mais besoin d’une analyse du sens des relations
80
À quoi sert les tableaux de contingence
Permet de facilement regrouper des information Tester le lien de dépendance/indép entre 2 variables catégorielle/nominale
81
Postulats d’utilisation pour les tableaux de contingence
Échantillon aléatoire (dans le cours, prendre pour quis que c'est aléatoire) Les nombres ne doivent pas être trop petits : Le total ne doit pas être plus petit que 20 La fréquence dans chaque case ne doit pas être inférieure à 5
82
indicateur pour les 3 questions (signification, force, sens)
signification : khi2 force : Phi ou V de Cramer sens : comparaiseon de % dans un tableau
83
# tableau de contingence À vérifier pour ''signification''
Rappel : deux variables **catégorielles/nominale** Le nom de la statistique utilisée : **X2 / Chi carré** Si chi2 est p<0.05 = relation significative
84
# tableau de contingence À vérifier pour ''force''
On ne peut pas déduire la force à partir de la significativité Phi pour 2 x 2 V de Cramer pour k x k
85
# tableau de contingence À vérifier pour ''sens''
**Tableau 2 x 2** : On regarde les pourcentages indiqués dans le tableau **Tableau k x k **: Plus difficile à interpréter Plus d’analyses sont nécessaires : Création de variables muettes (dummy variables) Variables **dichotomiques** Autant de variables muettes que de catégories ## Footnote Transformer le kxk en 2x2, Faire un chi2 à l’aide d’un tableau 2x2
86
Comment rapporter les résultats en examen
Question de recherche : Existe-t-il une **relation entre le statut de minorité visible du meurtrier et le sexe de la victime**? Réponse : I**l existe une relation statistiquement significative** entre le statut de minorité visible du meurtrier et le sexe de sa victime **(Chi2 = 10,46 ; p = 0,001)**. Cette r**elation peut être considérée comme faible (Phi = 0,17)**. Les meurtriers appartenant à une minorité visible ont **tué des hommes dans 75,8%** des cas **(n = 179)**, cette proportion étant **statistiquement supérieure** aux meurtriers n’appartenant pas à une minorité visible **(59,5% ; n = 75)**. ou Les meurtriers appartenant à une minorité visible ont tué des femmes dans 24,2% des cas (n = 57), cette proportion étant statistiquement inférieure aux meurtriers n’appartenant pas à une minorité visible (40,5% ; n = 51).
87
À quoi sert les tests de moyennes
Principe des tests de moyennes est de comparer des distributions pour voir si la différence entre les distributions est significative
88
Quelle famille de test va être utilisé pour une variable catégorielle ET une variable continue Nommez ses postulats (3)
famille des test de moyennes 1. Échantillon **aléatoires** indépendant 2. **Distribution** de la variable continue est **normale** 2. n>30 3. les variances sont comparables/homogènes (Test de **Levene** NON-SIGNIFICATIF p **>** 0.05 --> variance est similaire (dos de chameau) variance meh si p>0.05 et p<0,1 (une des bosses près de la moyenne) ## Footnote Idée test de moyenne est d’avoir plusieurs groupe et voir à quel point se distinguent avec un test continus
89
pour les test de moyennes, si les 3 potulats sont respectés, quel est le test à faire selon le nombre de groupes
2 groupes = T de student +2 groupes = Oneway Anova
90
Dans les statistiques bivariés, qu'est-ce qu'il faut faire pour deux variables catégorielles | postulats?
pas de postulats tableaux de contingence
91
Dans les statistiques bivariés, qu'est-ce qu'il faut faire pour deux variables continues | postulats?
Famille de correlations 1. variables continues 2. absence de valeur(s) extrême(s) 3. distribution normales 4. linéarité de la relation
92
Pour les tests de la famille des corrélation, quel test pour « oui » aux 4 postulats et « non » pour 1 des postulats
4/4 = test paramétrique - R de Pearson 3/4 et - = test non paramétrique - Rho de Spearman
93
Caratéristiques du test de T | 2 caratéristiques, principe, objectif
Variable catégorielle ET continue compare 2 groupes Principe: rapport de différence des moyennes sur l'erreur standard Objectif: déterminer si les 2 moyennes sont égales ou non Si moyennes similaires = non significatif Si moyennes différentes = significatif, donc lien statistiquement significatif
94
Les 3 questions à se poser pour le test t
**Signification**: Existe-t-il un lien (statistiquement significatif) entre mes variables ? - P associé au coefficient t **(p < 0.05)** **Force** : Ce lien est-il important ? - Valeur de l’Eta2 (force des tests de moyennes paramétriques) **Entre 0 et 1** **Sens** : Que veut dire ce lien concrètement ? (comparez les moyennes) - Comparaison de moyennes dans un tableau ## Footnote FORCE: Son interprétation va dépendre du domaine étudié et du type de domaine d’étude
95
# TEST t Quoi vérifier dans les tableaux
1. Valeu de N (>30) 2. Test Levene : SIG (>0.05 = good) 3. t-test: SIG 2 tailed (<0.05 = good) 4. Comparer les moyennes avec le tableau où il y avait N (SPSS : utiliser pour Eta2)
96
Objectif de one way anova et potulats
Objectif : comparer les moyennes de trois groupes ou plus Mêmes postulats d’utilisation que le test T !
97
# Oneway anova Comment savoir si test F non significatif
Si p>0.05 (trois bosses à la même place ou presque) Significatif même si 2 bosses sont à la même place tant qu'une est mis à part
98
# Oneway Anova objectifs des post hoc, leur nom et quand utilise
Objectif des post hoc : **comparer les sous-groupes** en tenant compte d’une correction mathématique de l’erreur **Scheffé** : utilisé dans le cas de groupes de **tailles différente ** **Tukey** : Utilisé seulement quand les groupes sont de **taille semblable**
99
Qu'est-ce que l'analyse de corrélation et son type de variable
comparer deux distributions pour savoir si la différence perçue entre celles-ci est significative ou si elle est due au hasard 2 variables continues
100
# Test de corrélation Comment quantifier le lien entre les 2 variables continues
Distance de chacun des points avec la droite hypothétique
101
# Test de corrélation Comment savoir si observations sont indépendante
les 2 variables ne doivent pas mesurer la même chose ou une partie de la même chose (ex: examen final et note intra)
102
Quoi reagarder pour savoir si graphique d'une distribution normale
ressemble courbe normale (une variable sur axe des x et nombre de participant sur axe des y)
103
Quoi reagarder pour savoir si graphique d'une relation linéaire
axe des x et axe des y avec un variable sur les axes
104
3 questions à se poser pour test de R de pearson
**Singification**: P associé au coefficient de corrélation r de Pearson **Force:** Valeur du r de Pearson petit = faible **Sens**: Le signe (+ ou -) de la valeur r de Pearson entre **-1 et 1** (-1 et 1 = l'un prédit l'autre parfaitement = rare)
105
Qu'Est-ce que le R^2
r^2 : proportion de variance expliquée (en %) (r x r) = Pourcentage qui correspond à la variabilité Dans quelle mesure **vi affecte vd**, savoir si relation entre les variables Ex: les placements antérieurs vont permettre de comprendre 56,3% de la variance dans le nb de crimes