Recherche quantitative Flashcards
(12 cards)
Cours 2 - Recherche scientifique. critere scientifique, quali et quantit, mixte, inductif et déductif
🍔Recherche scientifique : processus acquisition connaissance, cherche fait ou vérité. Répondre à des questions qu’on veut approfondir, hypothèses, résoudre problèmes. (faire avancer la science, appuyer interventions etc)
🍔Critère fait scientifique : - Observé empiriquement (pas une opinion, visible monde réel), - Obtenu grace à méthode approprié, - Lien recherche-théorie, - Vérifié et reproduit.
🍔Fidélité : méthode donne résultats constants et stable à travers le temps. Validité : Mesure-il ce qu’il est supposé mesurer?
🍔Quali 30, perception, aucun facteur à priori etc.
🍔Quanti : grand nombre 100 et plus. Concept théorique à priori. Questionnaire etc. tendance et généralisation. Pas vraiment émergence concept. Plus facile à respecter la fidélité et validité car stats.
🍔Utilité : - Mesurer et quantifier phénomènes sociaux, - Généraliser observations sur phénomène sociaux, - Analyse des données avec logiciel stats des données, - Représentativité (doit fitter, pop carcérale can femme peut pas appliquer étude sur pop carcéral homme en algérie.)
🍔Approche mixte : volet quanti et quali. Donnés quanti avec large échantillon, avec volet descriptif avec sous-groupe du mm échantillon. Combine force des 2 approches.
🍔Raisonnement inductif vs déductif.
- Inductif : Spécifique à général (faits à théories). Observations empiriques spécifiques ➡️ élaboration énoncés généraux. Observations ➡️ Identification patterns récurrents ➡️ conclusion préliminaire. Étude exploratoire et descriptive (quali)
- Déductif: Général à spécifique (théorie a observation empirique). Application théorie à problématique précise (hypothèse, observation pour vérifier hypothèse, acceptation ou rejet hypothèse). Étude explicative et prédictive / évaluative.
Types de variable. Buts recherche. Littérature scientifique
🍔Indépendante : celle qu’on manipule. Entraine variation pour autres variables.
- Dépendante : modifie suite manipulation indépendante. ex. prog intervention et taux récidive. Prog inter (VI) entraine - taux récidive (VD).
- Contrôle / tierce : peuvent jouer un role dans relation observé. On doit controler ou retirer l’effet (ex. controler l’âge quand regarder sport et santé cardiaque)
🍔Buts de la recherche : Influencé par niveau de savoir et connaissance sur le sujet.
1. Décrire (de quoi s’agit-il?) ; premiere étape. Peu d’info sur sujet. Descrption personnes, groupe etc. Dresser un portrait. Prévalence d’un phénomène. Observer caractéristique précisément.
2. Explorer (que se passe-t-il) : peu d’info sur sujet. Exploration facteurs associés. Dégager portrait général d’une situation.
3. Classifier (quels sont profils types?) : Catégoriser, typologie, nécessité catégoriser phénomènes afin d’agir, prendre des décisions.
4. Expliquer (pourquoi est-ce arrivé?) : Déterminer les causes (VI) et effets (VD), préciser sens relation, explique lien entre x,y,z, s’appuie souvent sur une théorie, supporter ou réfuter une hypothèse ou théorie, élaborer théorie, modélisation (modèle explicative, peut inclure plusieurs variable)
5. Prédire et évaluer (qu’est ce qui est efficace?) : Pivot étude intervention, causes et effets programme, loi etc. Est-ce que programme atteint objectif? Réduire criminalité? Quel programme est le + adéquat (dès qu’on évalue un programme, c’est ce but)
🍔Docu scientifique en ordre du moins au plus mportant :
1. Rapport de recherche (gov) : utile pour info précise ou descriptives, % de pop etc. Étude fait a international souvent (moins objectif), pas ou peu d’évaluation des pairs.
2. Chapitre de livre dans ouvrage collectif : utile pour avoir une revue critique de litérature scientifique sur sujet particulier. Théorie de .. etc. Étude passé en revue sont celle qu’auteur juge pertinent. Peut avoir idée novatrice. Pas toujours comité de pairs.
3. Livre / thèse doctorat : utile pour étude approfondie d’un sujet, voir plusieurs facette d’un mm thème, différence entre xx ou yy? le problème de la yy et xx ? Généralement comité lecture, évaluation pairs. Volumineux, info vaste et exhaustive. Info peut devenir exhaustive.
4. Article scientifique : sujet très précis, état connaissance actuelles (au moment publication). Présente des données (quanti, quali, nouvelles). Évaluation paris souvent anonyme et rigoureuse. Court, concis, respecter certaines normes présentation. Sujet et population analysés souvent très pointus, limite généralisation.
Revue scientifique, section article scientifique
🍔Titre, date : attention au date. Est-ce que article à suscité beaucoup d’intéret?
🍔Auteurs : Auteur ? Co-auteurs ? Discipline? Autre travaux sur sujet?
🍔Résumé / abstract : point saillant, juger rapidement. 200 mots.
🍔Revue littérature : Intro au sujet, état connaissance problématique au moment de l’étude. Pas d’idée de l’auteur. Revue des études antérieur. Définition concepts et dimensions importante.
🍔Buts de l’étude (problématique) : souvent dernier paragraphe avant métho. Objectifs étude? un plusieurs ? Avancement de la science? (identifier écart, manquement littérature?) Hypothèse recherche? VI VD? Cadre théorique ?
🍔Méthodologie (comment?): Quel type de design (devis) de recherche? Quanti, quali, mixte? Rétrospective (tout est arrivé, on regarde le passé). Prosepctive (pas encore arrivé, commence au début et suit chaque milestone). Donnés transversale (regarder une fois) ou longitudinales (plusieurs fois), unité analyse (situation, individu), Groupe contrôle ou expérimentale ?
🍔Échantillon : Influence la représentativité et possibilité de généralisation des résultats, Nature échantillonnage, Taille échantillon, Lieux et date, Méthode recrutement, Est-ce que échantillon est représentatif population ?
🍔Termes : 1. population : ensemble tt personnes que étude porte sur. 2. Échantillon : sous-ensemble de pop à l’étude, 3. Unité statistique : chaque élément de la pop.
🍔Variables et mesures : Informe sur nature et qualité info analysé. Validité conclusion? Comment données recueillie ? Contexte ? Outils ?
🍔Résultats :`Présentation données et analyses. Contribution originale de l’étude. Quali = peu de cas, mais en détail. Hypothèse venant de l’analyse. Quanti : Description grand nombre cas. Éval empirique hypothèse. Analyse stats utilisé.
- Selon but, différente analyse complétés. - Descriptive (pourcentage, ratio, moyenne), - Exploratoire (association entre variables, force association, niveau signification). - Classificatoires (regroupement, typologie, classes), - Explicatives (modélisation et variance expliqué), - Évaluative / prédictive (comparaison, régression)
🍔Discussion : Interprétation résultats lumière hypothèse et résultats études antérieur. Hypothèse supporté ou non? Résultats concorde ? Si non, comment expliquer ses divergences ? Hypothèse alternative? Limite énoncés.
🍔Conclusion : Rappel grande ligne. Retombés pratique / théorique résultats. Suggestions et ouverture pour le future.
🍔Bibliographie : étude cité par l’auteur seulement. Reflet de l’approche théorique et méthodologique de l’auteur. APA, MLA etc.
🍔Citations et référence : Paraphrase ou citation indirecte ou citation directe.
Cours 3 - Phase recherche quantitative
🍔Conceptuelle, Méthodologique, Empirique, Analytique, Diffussion.
🍔1) Phase conceptuelle : Élaboration thème recherche, exploration sources et recension, cadre de recherche, définition problématique, élaboration du but, objectifs, question de recherche. (Problématique = comblez manque dans recherche scientifique. But doit avoir lien avec problématique)
🍔Question de recherche : Énoncé interrogatif. Précise l’objectif et concept à l’étude, Précise population cible ou unité analyse, Permet connaitre l’angle et le niveau de recherche. Découle recension des écrits faille à combler. Concept indépendant en premier. Dépendant en deuxième. Dans question de recherche.
🍔2) Phase méthodologique : Choisir approche analytique, Conceptualisation / opérationnalisation concepts, Choisir méthode / technique de recherche, Définir population à l’étude. Définir la sorte et type d’échantillonage.
🍔Concept : Image mentale qui représente une observation, idée ou sentiment. Aide à référer à des termes et idées abstraites, ne peut être mesuré directement, définir ce que concept veut vraiment dire, mm concept peut avoir été défini différemment.
🍔On doit comprendre comment chercheur défini ses concepts clé, sinon impossible de comprendre signification. Toute décision que nous prenons sur la basedes résultats sur recherche empirique doit être fondé sur connaissance complète de manière dont la recherche a été concue.
🍔Conceptualisation : Processus ou nous mettons en mots une idée abstraite, idée théorique transposée dans langage opérationnel et précis.
- Brainstorming sur image évoqués par les concepts et jouer avec les définitions possibles. Regarde les recherches et théories antérieur, comment ils ont défini les concepts ? Peut la remettre en question! Doit comprendre comment concepts ont été défini dans le passé.
🍔Dimension : Concept se décompose en sous-catégorie. Aide à avoir meilleure idée de signification du concept, ce qu’il sous-entend. Ses facettes.
Opérationnalisation
🍔Opérationnalisation : Démarche qui permet de rendre mesurable les concepts à l’étude, capter réalité des phénomènes. Passer de l’abstrait au concret. Rendre mesurable avec des indicateurs (variables).
- 3 étapes : Identification des indicateurs, Création de variables ou indices, Identification / sélection des modalités de la variable (échelle de mesures)
Une sorte d’arbre. Concept (représentation mentale d’une idée). Dimension (1,2 ou +) : sous-thème ou différents sens du concept. Variable (caractéristique mesurable d’une dimension. p.5. Voir la page 6 et 7 pour une meilleure compréhension.)
- ex. Faible maitrise de soi (concept) = Préférence pour la gratification immédiate (dimensions) = Je ne me soucie pas de mon futur (variable) = 1) Jamais, 2) Rarement, 3) Quelquefois, 4) Toujours. (Échelle de la variable). De base ordre est concept, dimension et ensuite observations (variable)
🍔3) Phase empirique : cueillette donnés et création base donnés.
🍔4) Phase analytique : Nettoyage et préparation des données. Analyse (univarié, bivarié, multivarié) et interprétation des données
🍔5) Phase de diffusion : Présentation, publication et communication des résultats.
🍔Type de variables : - Échelle qualitatif : mesure qualité de quelque choses. Nominale et ordinale. - Échelle quantitatif : mesure quantité de quelque chose. Intervalle, Continue / de rapport. Type de variable + précis.
🍔Qualitative :
- Nominale : Qualifier des personnes, objets, groupes etc. Établir des différences. Dichotomique (2). Drogue consommé la plus fréquemment ? 1= pot, 2 = Hasch etc.
- Ordinale : Assigné par catégories de réponses pour établir un ordre de grandeur. Catégories ordonnées entre elles. Permet d’établir une relation d’ordre. ex. Aimez vous ? 1. non, 2. un peu etc. Ordinale = Ordre.
🍔Quantitative : Intervalle. Permet évaluer réponses l’écart entre 2 réponses ait une signification. Notion de distance + notion d’ordre. 0 signifie pas l’absence.
🍔Continue : 0 signifie l’absence de quelques choses. Rapport entre deux valeurs est interprétable. Ça donne un seul chiffre, valeur numérique. Ex. ton âge.
Échelles de mesure d’une variable
🍔Échelles de mesure d’une variable. 2 critère à respecter :
- exclusivité : personne ne peut se trouver dans 2 catégories.
- Exhaustivité : tt valeurs / modalités possibles de la variable sont présentes.
🍔Termes courants :
- Valeur : Différente quantités numériques possibles de la variable. (quanti)
- Modalité : Différentes réponses ou choix de réponses possible de la variable (quali)
Cours 4 - Analyse univarié
🍔Analyse univarié : 1 variable. Bivarié + 2. Multivarié = 3 et +.
- Univarié sert à : Décrire et présenter les données, PAS expliquer. Permet de montrer si des modifications sont nécessaires, recodé, manque une donné etc.
🍔Différente mesures :
🍔Mesure tendance centrale : résumer en un nombre la valeur la + représentative.
🍕Mode (MO) : + fréquente. Pour toute les types de variables. Plusieurs modes (uni ou multimodale). Simple. Prend pas en considération tt information disponible.
🍕Médiane (MD) : divise distribution 2 parties égale. Intervalle, continue ou ordinale
(+ commun). Utile si asymétrie. Complément à la moyenne. Pour le trouver, regarder quand le 50% est atteint, même si c’est plus. On sait que c’est ca.
🍕Moyenne (x) : somme donné divisé par nombre. Intervalle ou continue (quanti). Parfait si symétrique, très influencé par valeur extreme.
🍔Mesures de position : Quantiles : valeurs partage distribution en certain nombre de parties égales (quartiles, déciles etc)
🍔Mesure de dispersion : mesure niveau variation.
🍕Étendue: Renseigne sur étalement donnés. Différence entre valeur + élevé et - élevé. 2, 10, 52. Étendue = 50.
🍕Variance (s2) : Renseigne variabilité / homogénéité. Mesure distance chaque observation par rapport à la moyenne. Sensible valeur extrême. Si élevé = hétérogène. Si faible = homogénéité. = variance grande, + variation.
- Valeur abstraite, tough à interpréter.
🍕Écart-type (s) : Renseigne variabilité / homogénéité. Mesure distance observation par rapport moyenne, sensible valeur extremene. MAIS même métrique que variable. ^^ que variance.
🍔Représentation visuel variables : Peut être plus parlant. Retravailler les tableaux.
- Diagrammes circulaires : Surtout nominale (peut catégories)
- Diagrammes en bâtons : variables ordinales
- Histogramme : Variables continues
Cours 6 -Inspection et préparation des données.
🍔Inspection des données : Étape cruciale. Permet de : 1. Familiariser avec données en main. 2. Vérifier faisabilité de critères de base. 3. Déterminer le type d’analyse statistique adéquat.
🍔Inspection données : 1. Variable qualitative : observation et déclaration valeurs manquant. Inspection répartition parmi catégories. 2. Variable quantitative : inspection normalité. Gestion valeurs extrêmes.
🍔Données manquantes aléatoire (pas attribuable caractéristique participant, ex : perdu) ou non aléatoire (attribuale caractéristique ex. sais pas lire etc)
🍕Difficile à savoir : analyse statistiques pour vérifier si : aléatoire, moins de 5%-10% des données manquant = moins problématique. Sinon problème généralisation.
🍔1. Identification données manquantes : Ne sais pas (peut être manquante).
🍕2. Inspection répartition : - Variable dichotomique. Doit éviter utiliser variable si seulement 10% et - se trouve dans une des deux catégories. (pas assez de point de comparaison). - Variable catégorielle : Recoder pour éviter avoir catégories - de 10%.
🍔Quelques caractéristiques loi normale : 1. Courbe forme cloche, 2. Courbe est symétrique par rapport à droite verticale qui passe par la moyenne, 3. Mode, médiane, moyenne ont même valeur.
🍕4. Distribution normale données suit règle empirique : - Environ 68.3% situe +/- 1S de moyenne. - Environ 95.4% +/- 2S. - Environ 99.7% +/- 3S. 0.3% Valeur extrême. Les 3S probable. Le reste improbable.
🍔Symétrie : Mode = médiane = moyenne, 🍕 Asymétrie. Négative : mode > médiane > moyenne. Concentration valeurs fortes. 🍕Positive : mode < médiane < moyenne. Concentration valeurs faibles.
🍔Applatissement. - Mésokurtique : courbe normale (cloche). - Leptokurtique : courbe élancée. haute concentration cas prenne valeurs égale, homogène. - Platikurtique : courbe plate. s’éloigne moyenne. hétérogène.
Mesure symétrie. Aplatissement. Recodage et transformation
🍔Mesure de la symétrie : Utilisé pour vérifier distribution +/- normale.
- Utiliser rapport asymétrie et erreur standard. 0 = normale. Pos = asymétrie pos. Neg = asy neg. Si asy/es de l’asy > +/- 3.29 = non respect normalité. + ration élevé, + échantillon anormalement distribué.
🍔Mesure aplatissement : coefficient aplatissement vérifier si distribution +/- normale. - Utiliser rapport entre aplatissement et erreur standard aplatissement. 0 = normale. Pos : distribution leptokurtique. Neg : Platikurtique. Si apl./es de l’apl > 3.29 = non respect normalité.
🍔Valeurs extrêmes et normalité : Plus échantillon gros, moins avoir distribution +/- normale est grave. Si variable quanti, on peut : - Transformation. Change forme distribution pour se rapprocher courbe normale. - Éliminer cas / valeurs extrêmes.
🍔Recodage, pourquoi ? - Variable quali : - Limite nombre catégories, - Après inspection répartition répondants (-10%), - Mieux répondre objectif. - Transformer format variable à un autre.
🍔Variables quantitatives : Après inspection normalité de distribution, si problème.
🍔Méthode de normalisation distribution, Le Logarithme. Utiliser à la place d’enlever les valeurs extrêmes, quand c’est monétaire. Le LOG redistribue le poid que l’$ a si on en fait plus ou moins. Rapproche de la normalité. Donc représente pu de $. On doit le retransformer en $ après.
Cours 7 - Analyse bivarié, inférence statistique, étapes analyse bivarié
Notions de base :
🍔Types d’analyse : 1. Univarié (décrire et présenter les données), 2. Bivarié (Analyser l’effet d’une variable X sur autre Y), 3. Multivarié (Analyser effet de plusieurs variables sur une autre. Contrôler pour variable tierce / contrôle)
🍔Causalité, conditions nécessaire (rare en science sociale) : 1. Séquence temporelle (cause doit PRÉCÉDER l’effet. X cause Y.), 2. Association entre X et Y, X et Y sont présent. (vi et vd tjrs là), 3. Relation persiste même si inclut d’autre variables (pas influence variable tierce), 4. Deux concepts (Cause et effet) doivent être conceptuellement distincts. (pas de totologie), 5. Existe une interprétation possible de relation (si corrélation mais pas cause, pas bon!)
Hypothèse :
🍔Types d’analyse statistiques 2 buts : 1. Connaitre association entre 2 variables (est-ce que x est associé à y?), 2. Connaitre différence de groupes pour mm variable. (existe-t-il différence de x selon y ?)
🍕Non directionnelle : aucune mention sens de relation entre variable ou différences existantes. (ex. il existe une différence entre x selon y. x est associé à y). Pour accepter hypothèse de recherche, doit existe relation significative peu importe le sens. (durant analyse bivarié, on teste par défaut hypothèse non directionel. Basically juste dire est-ce qu’il y a une asso / différence?)
🍕Directionnelle : Sens relation / différences sont mentionnés. (ex. ceux sans emploi font en moyenne + de crimes que ceux à l’emploi. faible est associé à haut.). Pour accepter hypothèse de recherche, sens relation doit être juste.
- C’est vérifier la présence d’une association entre des variables (ou diff) qui soit statistiquement signifcative (bilatérale / non-direct)
🍕1. Hypothèse de recherche (H1) : présence association entre VI et VD.
2. Hypothèse nulle (H0) : Inverse, aucune association.
🍕Important de revenir à l’hypothèse nulle. Selon si procédure stats permet pas accepter H1 : - Rejet de H0 (RELATION SIGNIFICATIVE!) donc H1 est vrai. - Non-rejet de H0 (pas relation significative) pas nécessairement dire que h1 est faux.
Inférence statistique
Inférence statistiques
🍔Population et échantillon : Population (N) : ensemble toute personnes sur lequels porte étude. - Définir population ciblé en spécifiant : - Unité statistique (chaque personne), - Caractéristiques géo et temporelles (pareil que pop)
- Difficile accès a toute population.
🍔échantillon (n) : sous ensemble, extrait pop. - Importance représentavité échantillon! - Généralisation résultats, Échantillon aléatoire. (si juste délinquant MTL, peut pas généraliser en region)
🍔Fluctuant échantillons : Problème que plupart étude basé sur échantillons.
- Stats venant d’échantillons peuvent varier d’une étude à l’autre = estimation population et probabilité. - Importance reproduire études
- Divergence entre statistique émanant pop et échantillons.
🍕Théorie probabiliste : Probabilité (P) : nombre fois événement survient divisé par nombre occasions évènement puisse survenir.
🍕Ex population délinquant sex N=554. Taux de récidive 22.5%. Si on sépare en 6 échantillon de 25, certians taux 14%, d’autre 20%, 26%, 30%. Moyenne des échantilons de 24,27%. Taux différent selon l’échantillon. Plus d’échantillons, plus on s’approche de la moyenne populationnelle.
- Plus on a d’échantillons, plus on se rapproche des taux de la population. Plus on a une courbe normale.
🍔Inférence statistique consiste à induire les caractéristiques inconnues d’une population à partir d’un échantillon de cette population. Info connue (échantillon vers conclusion sur qlq chose d’inconnu (pop). C’est une inférence stats.
Suite inférence statistique
🍔Analyse échantillon renseigne sur pop que si représente adéquatement cette population = généralisation.
🍔Basé sur analyses statistiques : méthode permettant tirer conclusion fiable sur population, selon données obtenues pour échantillon (généralisation des résultats). - Permet minimiser probabilités tirer fausses conclusions quant paramêtre pop.
- Comme inférons données de pop à partir d’un échantillon (aléatoire) = possible résultats trouvés soient attribuable au hasard / erreur échantillonnage.
🍔Erreur d’échantillonnage : Loi des grands nombres. *+ taille échantillon grande, - erreur échantillonnage petite. *+ grande variance, + + grand erreur échantillonnage.
- Calculer grâce erreur type de la moyenne = écart type moyenne échantillons aléatoirement extrait pop.
🍔But : Déterminer si différences observés sont reflet de réelles différences dans pop ou résultats d’erreur d’échantillonnage / hasard.
- PAS possible si phénomène respect pas la loi normale.
- Analyse paramétrique (prend acquis qu’une valeur respecte loi normal) - Analyse non paramétrique (2 variable quali OU variable continue pas normalement distribué)
🍔Deux types erreur inférence : - Erreur type 1 alpha (Affirmation chercheur existe lien, mais réalité existe pas de lien)
- Erreur de type 2 beta : chercheur dit que pas de lien, mais réalité existe un lien)
🍔Seuil de signification : on se fixe un seuil. On controle le + possible pour ERREUR TYPE 1. p = seuil signification, type 1 = alpha.
🍕Seuil de signification accepté : p < 0.05 (95%), seuil en science social. Être certain a 95% que présence relation. .05 de chance de me tromper en affirmant qu’il existe relation (erreur de type 1). p < 0.01 (99%), p< 0.001 (99.99%)
🍕Donc, si p< 0.005 on peut rejeter H0 et conclure qu’existe relation significative en VI et VD. (rejet H0 = h1 vrai.)
- Si p > 0.05, pouvons pas conclure qu’il existe relation réelle entre VI et VD et devons converser hypothèse nulle (non rejet H0, h1 peut pas être vérifié)