Midterm Flashcards Preview

Stats > Midterm > Flashcards

Flashcards in Midterm Deck (68):
1

De quelle façon la problématique progresse?

Choix du thème général dans lequel on insère sa recherche. Première revue de la littérature. Objectif: tour d’horizon de ce qui a été écrit sur le thème général à travers le monde. Formulation d’un problème. Un problème de définit comme un écart entre une situation actuelle insatisfaisante et une situation idéale recherchée. Scientifiquement la raison pour laquelle on fait le sondage est que le sondage traduit de façon crédible avec une méthodologie solide et crédible.

2

Comment se fait la formulation de la question générale de recherche?

La démarche quantitative repose sur la confirmation ou l’information d’une hypothèse. L’hypothèse est donc central dans ce type de recherche. À cette étape de la recherche, le chercheur commence à songer aux facteurs qui ont permis cette progression.

3

Quels sont les buts de la deuxième de revue de littérature?

Montrer que vous maîtriser votre champ de recherche et que vous êtes au courant de la recherche antérieure pertinente à votre sujet. Évaluer l’étendue et la profondeur de la recherche en ce qui concerne votre sujet. Identifier des questions ou des aspects de votre sujet qui exigent plus de recherche (identifier des lacunes méthodologiques ou de résultats)

4

Qu’est-ce que la formulation du problème spécifique?

Circonscrire votre recherche de façon à ce qu’il soit réalisable en le limitant dans un espace spatial et temporel précis et réaliste.

5

Qu’est-ce que la question spécifique?

La question spécifique est l’objet de la recherche. Il s’agit du mandat confié à la recherche, celui de répondre à cette question à travers une hypothèse que vous allez formuler.

6

Qu’est-ce qu’une variable?

Une caractéristique qui peut supposer plus d’un ensemble de valeurs auquel il est possible d’attribuer une mesure numérique. La taille, l’âge, le revenu, la province où le pays de naissance, les années d’étude et le type de logement sont tous des exemples de variables.

7

Quelles sont les deux types de variable qualitative?

Nominale ou ordinale.

8

Quelle est la différence entre une variable nominale et ordinale?

Une variable nominale décrit un nom ou une catégorie contrairement à une variable ordinale, les noms ou les catégories possibles ne suivent pas un ordre naturel. Par exemple, le sexe et le logement.

9

Qu'est-ce qu'une variable ordinale?

Une variable dite catégorique dans laquelle les catégories possibles peuvent être classées dans un ordre spécifique ou dans un ordre naturel quelconque. Par exemple, la variable comportement est ordinale, parce que la catégorie excellent est meilleure que la catégorie très bon. On y trouve un certain ordre naturel, mais celui-ci est limité par le fait que nous ne savons pas dans quelle mesure le comportement excellent est meilleur que le comportement bon.

10

Qu'est-ce qu'une variable quantitative (numérique)?

Variable qui peut supposer un nombre infini de nombre réels. Par exemple, l'âge ou le nombre de membres d'un ménage. Les variables numériques peuvent être continues ou discrètes.

11

Qu'est-ce qu'une variable continue?

Elle peut supposer un nombre infini de valeurs réelles. Par exemple, la distance, l'âge et la température. La mesure d'un variable continue est toujours une approximation discrète.

12

Qu'est-ce qu'une variable discrète?

Elle ne peut revêtir qu'un nombre défini de valeurs réelles. Par exemple, la note accordée par un juge à un gymnaste à une compétition. La plage varie de 0 à 10 et ne comporte jamais plus d'une décimale. On peut aussi grouper des variables discrètes pour en faciliter la manipulation.

13

Qu'est-ce qu'une variable indépendante?

La variable qui est contrôlée et manipulée par l'expérimentateur. VI varie sans être influencé par les autres paramètres du problème. VI est représentée par X.

14

Qu'est-ce qu'une variable dépendante?

Variable qui est mesurée par l'expérimentateur. VC varie sous l'influence de la variable indépendante. VD est représentée par Y.

15

Qu'est-ce qu'une variable?

La variable est une caractéristique qui prend plus d'un ensemble de valeurs, ainsi, les indicateurs permettent à la variable de varier, de changer de valeur.

16

Qu'est-ce qu'un indicateur?

Les indicateurs servent à opérationnaliser les variables. C'est une manifestation observable d'un concept. Ce sont des éléments clés qui vous permettent d'infirmer ou de confirmer votre hypothèse. Sans les indicateurs, il n'y a pas de liens entre les variables dans le temps alors que la démarche quantitative repose sur la comparaison, la causalité, les indicateurs permettent cette comparaison, l'établissement de relation de cause à effet qui, du reste, ne repose que sur le faits (données).

17

Quelles sont les considérations préliminaires d'un échantillon?

Prendre une partie de la population mère (qui est très grosse), on ne choisit pas cette partie de façon aléatoire. Les individus ont des caractéristiques culturelles, socio-économiques (revenu, niveau d'éducation, quartier, statut civil, religion). Ces caractéristiques influencent les réponses. Le plus compliqué est de savoir quels types d'individus se trouve dans la population mère. L'échantillon doit être représentatif de tous les individus de la population mère. Savoir de quelle façon les informations sont recherchées et la méthode de données choisie. Nature des informations recherchées --> méthode de collecte des données --> processus d'échantillonnage.

18

Quelle est la précision des estimations?

La précision des estimations est en fonction: (1) la méthode d'échantillonnage, (2) de la taille de l'échantillon (contrôlable) ainsi que (3) de la variance des variables dans la population (non contrôlable), (4) les contraintes financières et temporelles et (5) l'importance des non réponses: certaines méthodes entraînent des taux de réponse non important. Pour que notre estimation soit précise, il nous faut choisir une bonne méthode d'échantillonnage.

19

Quel est le processus d'échantillonnage?

Définition de la population. Sélection du cadre d'échantillonnage. Définition des unités d'échantillonnage. Choix d'une méthode d'échantillonnage. Détermination de la taille de l'échantillon. Sélection de l'échantillon.

20

Quelle est la définition de la population?

Date, lieu et les caractéristiques socio-économiques pertinentes.

21

Qu'est-ce que la précision de la base de sondage?

Noms dans un annuaire téléphonique, liste d'électeurs, comme le lieu, le pâté de maisons, le ménage ou l'entreprise.

22

Comment préciser la méthode d'échantillonnage?

Échantillonnage systématique ou stratifié, etc.

23

Comment déterminer la taille de l'échantillon?

La taille de l'échantillon déterminera aussi le degré d'incertitude. L'accroissement de la taille de l'échantillon entraînera une diminution de l'erreur d'échantillonnage.

24

Qu'est-ce que l'échantillonnage probabiliste?

Échantillonnage aléatoire simple. Échantillonnage aléatoire stratifié (proportionnel ou non proportionnel). Échantillonnage en grappes (systématiques ou aréolaire). Échantillonnage en phases successives.

25

Qu'est-ce que l'échantillonnage non probabiliste?

Échantillonnage selon le jugement. Échantillonnage de convenance. Échantillonnage par quota. Échantillonnage en boule de neige. Échantillonnage volontaire.

26

Quels sont les concepts fondamentaux de l'échantillonnage probabiliste?

L'échantillonnage aléatoire simple: «Si un échantillon de taille n est tiré d'une population de taille N de telle sorte que chaque échantillon de la taille n présente la même probabilité d'être sélectionné, la procédure est appelée échantillonnage aléatoire simple.»

27

Quels sont les trois faits importants concernant la distribution d'échantillonnage de la moyenne?

Cette distribution est normale (à condition que n soit plus grand ou égal à 30). La moyenne de la distribution est égale à la moyenne de la population. La variance de la distribution diminue avec l'augmentation de n. La taille doit être bien calculée que cette taille renferme des gens représentatifs de la moyenne. La variance de la moyenne diminue au fur et à mesure qu'on augmente la taille de l'échantillon.

28

Qu'est-ce que la loi normale de Gauss?

Au fur et à mesure que la taille de l'échantillon augmente (et que la taille des classes diminue), l'histogramme devient de plus en plus régulier et se rapproche d'une courbe en cloche, appelée loi normale. La loi normale est la loi statistique la plus utile, car elle représente beaucoup de phénomènes aléatoires.

29

Comment mesurer la précision de l'estimation et erreur type?

L'erreur type permet d'évaluer la précision de l'estimation (quantifier l'écart entre une estimation fondée sur un échantillon et la vraie valeur tirée d'un recensement). Elle mesure le degré de variation de la moyenne d'un échantillon sur l'autre, lorsque ceux-ci sont issus de la même population. Elle se base sur la notion du prélèvement de plusieurs échantillons, or, dans une enquête, on ne prélève qu'un seul échantillon. Dans l'échantillonnage, nous estimons donc une formule, un outil qui permet de prédire l'estimation. Outil qui s'appelle l'erreur type qui permet d'évaluer la précision de nos estimations.

30

Qu'est-ce que l'erreur type?

L'erreur type représente le degré de fiabilité de la moyenne de l'échantillon, par rapport à la moyenne de l'ensemble d'une population. Plus l'échantillon est grand, plus l'erreur type est faible et plus la moyenne de l'échantillon se rapproche de la moyenne de la population d'origine.

31

Quelle est la signification de l'erreur type?

L'erreur type est élevé: un autre chercheur fait la même recherche dans la même population et prélève un autre échantillon, la moyenne de son échantillon sera différente de la vôtre. L'erreur type est moindre: l'autre chercheur aura la même moyenne que la vôtre dans un échantillon différent.

32

Qu'est-ce que l'intervalle de confiance?

La probabilité P(1-a), arbitrairement choisie, s'appelle le niveau de confiance de l'intervalle de confiance. Les valeurs de a sont donc 0,05 et 0,01 correspondant aux niveaux de confiance 95% et 99%. . Pour un échantillon donné, la taille de l'intervalle de confiance dépend du niveau de confiance choisi. Le degré de confiance est en principe exprimé sous la forme d'une probabilité. Si on augmente la valeur du niveau de confiance, la longueur de l'intervalle de confiance augmente, parce que c'est la seule façon d'augmenter la chance de retrouver la véritable moyenne de la population. Le niveau de confiance traduit le degré de certitude de la marge d'erreur. Il exprime combien de fois le vrai pourcentage de la population qui choisirait une réponse, se trouve dans la marge d'erreur.

33

Qu'est-ce que la marge d'erreur?

Nous avons dit que la moyenne réelle, celle de la population de laquelle a été extraite l'échantillon est estimée. Alors qui parle d'estimation, parle de fourchette et d'erreur. On appelle marge d'erreur associée à un intervalle de confiance la demi-longueur de cet intervalle. Un intervalle d'erreur moins grande demande une taille d'échantillon plus grande.

34

Qu'est-ce que sont l'intervalle de confiance et la marge d'erreur?

Ce sont des indicateurs de précision des résultats d'une enquête. Le niveau de confiance devrait toujours figurer dans la déclaration de la marge d'erreur. Le niveau de confiance déclaré est souvent 19 fois sur 20 (niveau de confiance de 95%) ou 9 fois sur 10 (niveau de confiance de 90%). Pour un résultat d'échantillonnage donné, plus le niveau de confiance est élevé, plus la marge d'erreur sera grande. NB: le niveau de confiance et la marge d'erreur ne font qu'indiquer les erreurs d'échantillonnage.

35

Comment fait-on le calcul de la taille de l'échantillon de base?

Trois facteurs nécessaires pour le calcul: la prévalence estimative de la variable étudiée - pourcentage des personnes qui aiment la BMW dans la population globale. Le niveau de confiance visé et la marge d'erreur acceptable. Quand on ne connaît pas la taille de notre population, on prend 50% comme taille, pourcentage fixé par les statisticiens.

36

Qu'est-ce que l'effet du plan d'échantillonnage (deuxième étape)?

L'enquête repose sur une échantillon en grappes (sélection représentative de quartiers) et non pas sur un échantillon aléatoire simple. Pour corriger la différence, on multiplie la taille de l'échantillon par l'effet du plan d'échantillonnage. On suppose généralement que cet effet est de 2 pour les enquêtes faisant appel au sondage en grappes.

37

Quel est la troisième étape de l'échantillonnage?

Impondérables. On ajoute encore 5% à l'échantilllon pour tenir compte d'impondérables comme les non-réponses ou les erreurs d'enregistrement.

38

Quelle est la quatrième étape d'échantillonnage?

Distribution des sujets observés. Pour conclure, on arrondit le chiffre obtenu au nombre le plus proche du nombre de grappes à étudier. On divise ensuite la taille de l'échantillon N par le nombre de grappes pour déterminer le nombre de sujets à observer par grappe.

39

Quelle est la procédure de l’échantillonnage aléatoire simple?

Dresser une liste de toutes les unités de la population. Puis sélectionner au hasard avec ou sans remise.

40

Quelle est la procédure d’échantillonnage systématique?

Numéroter de 1 à N les unités de votre base de sondage. Déterminer l’intervalle d’échantillonnage (K) en divisant la population N par la taille de l’échantillon prévu. Sélectionner au hasard un nombre entre 1 et K. Ce nombre = l’origine choisie au hasard. Sélectionner chaque Kième unité à partir de ce nombre. K = le nombre par lequel on divise notre échantillon par exemple par 10, choisir chaque 10e personne.

41

Qu’est-ce que l’estimation?

L’estimation est le processus consistant à déterminer une valeur vraisemblable pour une variable de la population observée, en se fondant sur des données recueillies à partir de l’échantillon. Ce qui sous-tend le processus d’estimation, c’est le poids d’échantillonnage d’une unité qui indique le nombre d’unités incluses dans la population (y compris le poids de l’échantillonnage lui-même) et qui sont représentées par cette unité échantillonnée. Plus complexe, nécessite plus, plus de maturité. Nous estimons la vraie valeur pour ce faire on a besoin de garder une taille précise, si on perd dans la taille de notre échantillon. Plus la taille de l’échantillon grossit, plus nous nous rapprochons de la taille réelle.

42

Qu'est-ce que la notion de poids par individu?

Nous accordons un point à chaque unité. Chaque personne dans la population, dans notre échantillon représente trois personnes par exemple dans la population globale, dans l'exemple que j'ai une population de 30 personnes et que je choisis dans mon échantillon 10 personnes. Si je perds une de ces personnes, le point par individu augmente. La notion de poids devient très importante compte tenu du fait que nous estimons. Les données sur lesquelles nous estimons doivent être précises.

43

Qu'est-ce que l'échantillonnage aléatoire stratifié?

Chaque strate représente une partie, par exemple, la strate 1 représente les hommes, échantillonner dans la strate des hommes et ensuite échantillonner dans la strate des femmes. Chaque strate devient une population autonome. Chaque strate est une population à part, calculer l'échantillon, la moyenne, la variation (écart type) dans chacune des strates.

44

Quelle est la précision de l'échantillonnage aléatoire?

En examinant l'expression mathématique de la marge d'erreur on constate qu'il s'agit d'une sommation pondérée des variances estimées dans les strates. Si les strates sont homogènes, la variance totale sera moindre que celle qu'on obtient par échantillonnage simple. Donc, on aura des estimations plus précises si la variance dans les strates est petite et si la variance entre les strates est grande.

45

Comment choisir une variable de stratification?

Le chercheur doit choisir une variable de stratification qui aura pour effet de minimiser la variance de la variable à estimer à l'intérieur des strates et de maximiser la variance entre les strates. Par exemple, si la variable à estimer est le revenu, la variable de stratification sera éducation, emploi, l'intention de vote avec l'appartenance à un parti et consommation et taille du ménage. Choisir une variable de stratification qui va aider à avoir une variance moindre dans la strate. Pour arriver à minimiser la variance dans les strates.

46

Comment déterminer si la stratification est proportionnelle ou non?

La décision dépend de 4 facteurs: le nombre d'éléments dans chaque strate de la population, l'importance relative des strates dans le cadre du projet, la variance dans chaque strate (la précision est plus grande si on augmente la taille d'échantillon dans les strates ayant un variance plus grande) et les coûts d'échantillonnage pour chaque strate.

47

Qu'est-ce que le redressement?

Le redressement d'échantillon est une technique qui consiste à modifier l'échantillon lors d'une enquête pour s'assurer de sa représentativité. Le redressement est nécessaire lorsqu'un biais a provoqué la surreprésentation ou la sous-représentation de certaines catégories de répondant au sein de l'échantillon final. Le redressement peut se faire par extraction de profils surreprésentés ou en comptabilisant plusieurs fois des profits sous-représentés. L'idée est de se rapprocher d'une moyenne réaliste.

48

Qu'est-ce que le redressement d'un échantillon par pondération?

On peut aussi envisager le redressement comme une pondération des données selon les proportions relatives des catégories dans la population et dans l'échantillon. Lors du dépouillement, on attribue à chaque répondant un poids. Ce poids est supérieur à 1 si sa catégorie n'est pas assez représentée et il est inférieur à un si sa catégorie est surreprésenté. L'avis d'un individu ne pèsera plus 1 mais ce nouveau poids calculé. Par exemple, si j'ai deux fois moins de femmes que prévu dans mon échantillon, le poids d'une femme sera 2 et la réponse de chaque femme comptera double. Cette méthode de redressement nécessite l'aide d'un logiciel. Pour chaque catégorie, il convient de calculer le poids à utiliser en vue du redressement par pondération.

49

Quelle est la procédure d'échantillonnage en grappes?

On divise la population en sous-ensembles distincts qu'on appelle des grappes. On sélectionne ensuite un échantillon aléatoire dans les grappes. Tous les éléments qui composent les grappes choisies constituent l'échantillon final.

50

Quelle est la justification de l'échantillonnage en grappes?

Dans certaines conditions, la marge d'erreur associée aux estimations d'une moyenne ou d'une proportion sera plus petite que celle qu'on obtient avec un échantillon aléatoire simple.

51

Quelle est la précision de l'échantillonnage en grappes?

L'échantillonnage aléatoire stratifié donne lieu à des estimations plus précises lorsque la variance dans les strates est petite et que la variance entre les strates est grande. À l'opposé de l'échantillonnage en grappes, il vaut mieux que les grappes soient le plus semblables possible afin d'assurer une bonne représentation de la population. Dans l'échantillonnage, il vaut mieux que les grappes soient le plus semblable possible pour assurer une bonne représentation de la population.

52

Quelles sont les conditions qui favorisent la précision des estimations dans l'échantillonnage aléatoire stratifié?

Homogénéité dans les strates et hétérogénéité entre les strates.

53

Quelles sont les conditions qui favorisent la prévision des estimations dans l'échantillonnage en grappes?

Hétérogénéité dans les grappes et homogénéité entre les grappes.

54

Quel est le cas particulier de l'échantillonnage systématique en grappes?

On dispose les éléments de la population l'un à la suite de l'autre, sans ordre défini. Après un départ aléatoire, on choisir un élément à tous les k éléments.

55

Quel est la cas particulier de l'échantillonnage aréolaire (en grappes)?

Il s'agit d'une méthode d'échantillonnage fondée sur la géographie. On divise une population délimitée géographiquement (par exemple une ville) en bloc (par exemple des rues). On sélectionne un échantillon aléatoire, de blocs et on interroge tous les résidents des blocs choisis.

56

Quelle est la procédure d'échantillonnage en phases successives?

Il s'agit d'appliquer en séquence une combinaison de méthodes d'échantillonnage. Plusieurs combinaisons sont possibles. Par exemple, l'échantillonnage aréolaire en deux phases. Après avoir sélectionné un échantillon de bloc (par exemple, des rues) on tire un échantillon aléatoire ou systématique de résidents dans chaque bloc.

57

Quelles sont les sources d'estimation qui ne découlent pas de l'échantillonnage?

Les erreurs d'estimation ne proviennent pas uniquement de l'échantillonnage. Par exemple, l'estimation des dépenses moyennes de consommation est biaisée parce que l'échantillon a été tiré à partir d'un cadre d'échantillonnage incomplet. Par exemple, l'estimation des intentions d'achat est biaisé parce qu'un nombre important de personnes ont refusé de répondre au questionnaire. Plusieurs chercheurs en marketing croient que ces biais sont non seulement plus fréquents, mais aussi plus importants que les erreurs qui sont dues à l'échantillonnage.

58

Quelle est la classification des types de biais?

Biais: non-observation (couverture incomplète ou non-réponse) ou observation (collecte des données ou traitement des données).

59

Que faire en cas d'une couverture incomplète?

Améliorer le cadre d'échantillonnage. Ne pas utiliser le cadre d'échantillonnage.

60

Que faire en cas de non-réponse?

Augmenter le taux de contact (visites répétées, prise de rendez-vous), recourir à des interviews expérimentées, offrir une compensation financière et employer le modèle de réponse aléatoire.

61

Que faire en cas de collecte de données?

Contrôler le travail des intervieweurs.

62

Que faire en cas de traitement de données?

Vérifier et nettoyer la base des données. Vérifier la cohérence des analyses.

63

Que signifie imputer?

Remplacer les données manquantes, mais combien? La collecte des données permet de contrôler le travail des intervieweurs. Le traitement des données permet de vérifier et nettoyer la base de données et vérifier la cohérence des analyses.

64

Quelles sont les méthodes d'imputation?

Méthode du hot deck, méthode de substitution, méthode de l'estimateur et méthode du cold deck.

65

Quelle est la méthode du hot deck?

Recourir à d'autres répondants de la même enquête. Le répondant peut être choisi au hasard parmi un groupe de donneurs affichant le même jeu de caractéristiques prédéterminées.

66

Quelle est la méthode de substitution?

Les données imputées peuvent être extraites de l'enregistrement du répondant obtenu lors d'un cycle antérieur de l'enquête ou d'un autre fichier source.

67

Quelle est la méthode de l'estimateur?

Par exemple, l'imputation moyenne. Cette méthode permet l'insertion dans le champ vierge d'une valeur moyenne tirée des unités déclarante affichant le même jeu de caractéristiques prédéterminées. Par exemple, s'il manque le revenu à un enregistrement, nous pourrions imputer le revenu moyen de la même province pour la même profession.

68

Quelle est la méthode du cold deck?

Ressemble à celle du hot deck sauf que le donneur ne provient pas de la même enquête. Il peut venir d'enquêtes antérieures ou alors d'un recensement. Ces valeurs peuvent découler de données historiques, de l'expertise de la spécialité, etc. Un questionnaire «parfait» est créé pour répondre aux besoins complets ou partiels.