Midterm Flashcards

Question

Qu'est-ce que l'échantillonnage non probabiliste?

Answer 1

Échantillonnage selon le jugement. Échantillonnage de convenance. Échantillonnage par quota. Échantillonnage en boule de neige. Échantillonnage volontaire.

Answer 2

L'échantillonnage aléatoire simple: «Si un échantillon de taille n est tiré d'une population de taille N de telle sorte que chaque échantillon de la taille n présente la même probabilité d'être sélectionné, la procédure est appelée échantillonnage aléatoire simple.»

Answer 3

Cette distribution est normale (à condition que n soit plus grand ou égal à 30). La moyenne de la distribution est égale à la moyenne de la population. La variance de la distribution diminue avec l'augmentation de n. La taille doit être bien calculée que cette taille renferme des gens représentatifs de la moyenne. La variance de la moyenne diminue au fur et à mesure qu'on augmente la taille de l'échantillon.

Answer 4

Au fur et à mesure que la taille de l'échantillon augmente (et que la taille des classes diminue), l'histogramme devient de plus en plus régulier et se rapproche d'une courbe en cloche, appelée loi normale. La loi normale est la loi statistique la plus utile, car elle représente beaucoup de phénomènes aléatoires.

Answer 5

L'erreur type permet d'évaluer la précision de l'estimation (quantifier l'écart entre une estimation fondée sur un échantillon et la vraie valeur tirée d'un recensement). Elle mesure le degré de variation de la moyenne d'un échantillon sur l'autre, lorsque ceux-ci sont issus de la même population. Elle se base sur la notion du prélèvement de plusieurs échantillons, or, dans une enquête, on ne prélève qu'un seul échantillon. Dans l'échantillonnage, nous estimons donc une formule, un outil qui permet de prédire l'estimation. Outil qui s'appelle l'erreur type qui permet d'évaluer la précision de nos estimations.

Answer 6

L'erreur type représente le degré de fiabilité de la moyenne de l'échantillon, par rapport à la moyenne de l'ensemble d'une population. Plus l'échantillon est grand, plus l'erreur type est faible et plus la moyenne de l'échantillon se rapproche de la moyenne de la population d'origine.

Answer 7

L'erreur type est élevé: un autre chercheur fait la même recherche dans la même population et prélève un autre échantillon, la moyenne de son échantillon sera différente de la vôtre. L'erreur type est moindre: l'autre chercheur aura la même moyenne que la vôtre dans un échantillon différent.

Answer 8

La probabilité P(1-a), arbitrairement choisie, s'appelle le niveau de confiance de l'intervalle de confiance. Les valeurs de a sont donc 0,05 et 0,01 correspondant aux niveaux de confiance 95% et 99%. . Pour un échantillon donné, la taille de l'intervalle de confiance dépend du niveau de confiance choisi. Le degré de confiance est en principe exprimé sous la forme d'une probabilité. Si on augmente la valeur du niveau de confiance, la longueur de l'intervalle de confiance augmente, parce que c'est la seule façon d'augmenter la chance de retrouver la véritable moyenne de la population. Le niveau de confiance traduit le degré de certitude de la marge d'erreur. Il exprime combien de fois le vrai pourcentage de la population qui choisirait une réponse, se trouve dans la marge d'erreur.

Answer 9

Nous avons dit que la moyenne réelle, celle de la population de laquelle a été extraite l'échantillon est estimée. Alors qui parle d'estimation, parle de fourchette et d'erreur. On appelle marge d'erreur associée à un intervalle de confiance la demi-longueur de cet intervalle. Un intervalle d'erreur moins grande demande une taille d'échantillon plus grande.

Answer 10

Ce sont des indicateurs de précision des résultats d'une enquête. Le niveau de confiance devrait toujours figurer dans la déclaration de la marge d'erreur. Le niveau de confiance déclaré est souvent 19 fois sur 20 (niveau de confiance de 95%) ou 9 fois sur 10 (niveau de confiance de 90%). Pour un résultat d'échantillonnage donné, plus le niveau de confiance est élevé, plus la marge d'erreur sera grande. NB: le niveau de confiance et la marge d'erreur ne font qu'indiquer les erreurs d'échantillonnage.

Answer 11

Trois facteurs nécessaires pour le calcul: la prévalence estimative de la variable étudiée - pourcentage des personnes qui aiment la BMW dans la population globale. Le niveau de confiance visé et la marge d'erreur acceptable. Quand on ne connaît pas la taille de notre population, on prend 50% comme taille, pourcentage fixé par les statisticiens.

Answer 12

L'enquête repose sur une échantillon en grappes (sélection représentative de quartiers) et non pas sur un échantillon aléatoire simple. Pour corriger la différence, on multiplie la taille de l'échantillon par l'effet du plan d'échantillonnage. On suppose généralement que cet effet est de 2 pour les enquêtes faisant appel au sondage en grappes.

Answer 13

Impondérables. On ajoute encore 5% à l'échantilllon pour tenir compte d'impondérables comme les non-réponses ou les erreurs d'enregistrement.

Answer 14

Distribution des sujets observés. Pour conclure, on arrondit le chiffre obtenu au nombre le plus proche du nombre de grappes à étudier. On divise ensuite la taille de l'échantillon N par le nombre de grappes pour déterminer le nombre de sujets à observer par grappe.

Answer 15

Dresser une liste de toutes les unités de la population. Puis sélectionner au hasard avec ou sans remise.

Answer 16

Numéroter de 1 à N les unités de votre base de sondage. Déterminer l’intervalle d’échantillonnage (K) en divisant la population N par la taille de l’échantillon prévu. Sélectionner au hasard un nombre entre 1 et K. Ce nombre = l’origine choisie au hasard. Sélectionner chaque Kième unité à partir de ce nombre. K = le nombre par lequel on divise notre échantillon par exemple par 10, choisir chaque 10e personne.

Answer 17

L’estimation est le processus consistant à déterminer une valeur vraisemblable pour une variable de la population observée, en se fondant sur des données recueillies à partir de l’échantillon. Ce qui sous-tend le processus d’estimation, c’est le poids d’échantillonnage d’une unité qui indique le nombre d’unités incluses dans la population (y compris le poids de l’échantillonnage lui-même) et qui sont représentées par cette unité échantillonnée. Plus complexe, nécessite plus, plus de maturité. Nous estimons la vraie valeur pour ce faire on a besoin de garder une taille précise, si on perd dans la taille de notre échantillon. Plus la taille de l’échantillon grossit, plus nous nous rapprochons de la taille réelle.

Answer 18

Nous accordons un point à chaque unité. Chaque personne dans la population, dans notre échantillon représente trois personnes par exemple dans la population globale, dans l'exemple que j'ai une population de 30 personnes et que je choisis dans mon échantillon 10 personnes. Si je perds une de ces personnes, le point par individu augmente. La notion de poids devient très importante compte tenu du fait que nous estimons. Les données sur lesquelles nous estimons doivent être précises.

Answer 19

Chaque strate représente une partie, par exemple, la strate 1 représente les hommes, échantillonner dans la strate des hommes et ensuite échantillonner dans la strate des femmes. Chaque strate devient une population autonome. Chaque strate est une population à part, calculer l'échantillon, la moyenne, la variation (écart type) dans chacune des strates.

Answer 20

En examinant l'expression mathématique de la marge d'erreur on constate qu'il s'agit d'une sommation pondérée des variances estimées dans les strates. Si les strates sont homogènes, la variance totale sera moindre que celle qu'on obtient par échantillonnage simple. Donc, on aura des estimations plus précises si la variance dans les strates est petite et si la variance entre les strates est grande.

Answer 21

Le chercheur doit choisir une variable de stratification qui aura pour effet de minimiser la variance de la variable à estimer à l'intérieur des strates et de maximiser la variance entre les strates. Par exemple, si la variable à estimer est le revenu, la variable de stratification sera éducation, emploi, l'intention de vote avec l'appartenance à un parti et consommation et taille du ménage. Choisir une variable de stratification qui va aider à avoir une variance moindre dans la strate. Pour arriver à minimiser la variance dans les strates.

Answer 22

La décision dépend de 4 facteurs: le nombre d'éléments dans chaque strate de la population, l'importance relative des strates dans le cadre du projet, la variance dans chaque strate (la précision est plus grande si on augmente la taille d'échantillon dans les strates ayant un variance plus grande) et les coûts d'échantillonnage pour chaque strate.

Answer 23

Le redressement d'échantillon est une technique qui consiste à modifier l'échantillon lors d'une enquête pour s'assurer de sa représentativité. Le redressement est nécessaire lorsqu'un biais a provoqué la surreprésentation ou la sous-représentation de certaines catégories de répondant au sein de l'échantillon final. Le redressement peut se faire par extraction de profils surreprésentés ou en comptabilisant plusieurs fois des profits sous-représentés. L'idée est de se rapprocher d'une moyenne réaliste.

Answer 24

On peut aussi envisager le redressement comme une pondération des données selon les proportions relatives des catégories dans la population et dans l'échantillon. Lors du dépouillement, on attribue à chaque répondant un poids. Ce poids est supérieur à 1 si sa catégorie n'est pas assez représentée et il est inférieur à un si sa catégorie est surreprésenté. L'avis d'un individu ne pèsera plus 1 mais ce nouveau poids calculé. Par exemple, si j'ai deux fois moins de femmes que prévu dans mon échantillon, le poids d'une femme sera 2 et la réponse de chaque femme comptera double. Cette méthode de redressement nécessite l'aide d'un logiciel. Pour chaque catégorie, il convient de calculer le poids à utiliser en vue du redressement par pondération.

Answer 25

On divise la population en sous-ensembles distincts qu'on appelle des grappes. On sélectionne ensuite un échantillon aléatoire dans les grappes. Tous les éléments qui composent les grappes choisies constituent l'échantillon final.

Answer 26

Dans certaines conditions, la marge d'erreur associée aux estimations d'une moyenne ou d'une proportion sera plus petite que celle qu'on obtient avec un échantillon aléatoire simple.

Answer 27

L'échantillonnage aléatoire stratifié donne lieu à des estimations plus précises lorsque la variance dans les strates est petite et que la variance entre les strates est grande. À l'opposé de l'échantillonnage en grappes, il vaut mieux que les grappes soient le plus semblables possible afin d'assurer une bonne représentation de la population. Dans l'échantillonnage, il vaut mieux que les grappes soient le plus semblable possible pour assurer une bonne représentation de la population.

Answer 28

Homogénéité dans les strates et hétérogénéité entre les strates.

Answer 29

Hétérogénéité dans les grappes et homogénéité entre les grappes.

Answer 30

On dispose les éléments de la population l'un à la suite de l'autre, sans ordre défini. Après un départ aléatoire, on choisir un élément à tous les k éléments.

Answer 31

Il s'agit d'une méthode d'échantillonnage fondée sur la géographie. On divise une population délimitée géographiquement (par exemple une ville) en bloc (par exemple des rues). On sélectionne un échantillon aléatoire, de blocs et on interroge tous les résidents des blocs choisis.

Answer 32

Il s'agit d'appliquer en séquence une combinaison de méthodes d'échantillonnage. Plusieurs combinaisons sont possibles. Par exemple, l'échantillonnage aréolaire en deux phases. Après avoir sélectionné un échantillon de bloc (par exemple, des rues) on tire un échantillon aléatoire ou systématique de résidents dans chaque bloc.

Answer 33

Les erreurs d'estimation ne proviennent pas uniquement de l'échantillonnage. Par exemple, l'estimation des dépenses moyennes de consommation est biaisée parce que l'échantillon a été tiré à partir d'un cadre d'échantillonnage incomplet. Par exemple, l'estimation des intentions d'achat est biaisé parce qu'un nombre important de personnes ont refusé de répondre au questionnaire. Plusieurs chercheurs en marketing croient que ces biais sont non seulement plus fréquents, mais aussi plus importants que les erreurs qui sont dues à l'échantillonnage.

Answer 34

Biais: non-observation (couverture incomplète ou non-réponse) ou observation (collecte des données ou traitement des données).

Answer 35

Améliorer le cadre d'échantillonnage. Ne pas utiliser le cadre d'échantillonnage.

Answer 36

Augmenter le taux de contact (visites répétées, prise de rendez-vous), recourir à des interviews expérimentées, offrir une compensation financière et employer le modèle de réponse aléatoire.

Answer 37

Contrôler le travail des intervieweurs.

Answer 38

Vérifier et nettoyer la base des données. Vérifier la cohérence des analyses.

Answer 39

Remplacer les données manquantes, mais combien? La collecte des données permet de contrôler le travail des intervieweurs. Le traitement des données permet de vérifier et nettoyer la base de données et vérifier la cohérence des analyses.

Answer 40

Méthode du hot deck, méthode de substitution, méthode de l'estimateur et méthode du cold deck.

Answer 41

Recourir à d'autres répondants de la même enquête. Le répondant peut être choisi au hasard parmi un groupe de donneurs affichant le même jeu de caractéristiques prédéterminées.

Answer 42

Les données imputées peuvent être extraites de l'enregistrement du répondant obtenu lors d'un cycle antérieur de l'enquête ou d'un autre fichier source.

Answer 43

Par exemple, l'imputation moyenne. Cette méthode permet l'insertion dans le champ vierge d'une valeur moyenne tirée des unités déclarante affichant le même jeu de caractéristiques prédéterminées. Par exemple, s'il manque le revenu à un enregistrement, nous pourrions imputer le revenu moyen de la même province pour la même profession.

Answer 44

Ressemble à celle du hot deck sauf que le donneur ne provient pas de la même enquête. Il peut venir d'enquêtes antérieures ou alors d'un recensement. Ces valeurs peuvent découler de données historiques, de l'expertise de la spécialité, etc. Un questionnaire «parfait» est créé pour répondre aux besoins complets ou partiels.

Midterm Flashcards

(68 cards)