cours 4 et 5 Flashcards
(48 cards)
Qu’est ce qu’une distribution normale?
C’est une distribution qui décrit un grand nombre de phénomènes dans la nature, beaucoup de caractéristiques physiques, sociologiques et psychologiques et qui est unimodale, symétrique et non aplatie.
Vrai ou faux, on effectue des tests paramétriques dans le cas d’une distribution normale, puis des tests non paramétrique dans le cas d’une distribution anormale.
Vrai
Quelles sont les étapes pour déterminer la densité / probabilité de n’importe quelle valeur?
1.Calculer la moyenne et l’écart type de la distribution 2. Transformer la valeur qui vous intéresse en score z; 3. Trouver la valeur z dans le tableau de la densité;
Lire la valeur correspondante immédiatement à droite (larger portion) Il s’agit de la proportion des observations qui sont égales ou inférieures à cette valeur En soustrayant de 1, nous obtenons la proportion des observations qui lui sont supérieures.
Comment calculer une valeur X (exemple note à l’examen) à partir d’un percentile, une moyenne et un écart type
1.À partir du percentile, trouver la densité dans le tableau.
2.Trouver le score z correspondant.
3.Calculer le score en valeur originale
X = (Z * S) + M
Comment savoir si une observation est rare ou fréquente?
- Trouver la densité pour l’observation.
- Calculer la densité supérieure à cette observation.
- La densité supérieure est la probabilité qu’elle soit rare. Si la probabilité est petite, l’observation est rare.
Un évènement est rare lorsqu’il apparait moins que 5% des fois dans une distribution.
Que présente une population?
Elle présente la VÉRITÉ ABSOLUE d’un phénomène naturel. Attention: il faut que la mesure soit valide!
En effet, la vérité est obtenue à partir de la mesure. Si la mesure porte à faire des erreurs, ce sera une vérité absolue, mais faussée (validité / fidélité).
La population est donc, en termes statistiques, l’ensemble d’unités généralisé par un modèle statistique (par un échantillon)
Qu’est ce qu’un recensement?
Lorsque l’on prend une mesure à partir d’une population
ex :
- Temps requis pour terminer un programme de baccalauréat à l’UdeM
- La note moyenne des étudiants à l’examen mi-session du cours PSY 1004
Est-il vrai de dire que, dans la plupart du cas, il est quasi impossible de mesure une population entière? élabore
Oui, c’est vrai, exemple, dans le cas ou on voudrait mesurer :
- Le degré de motivation des formations en statistique
- Le salaire de la population québécoise
Qu’est ce qu’un échantillon?
Ce sont les informations concernant un phénomène obtenues sur une PARCELLE des observations réelles (existantes). C’est donc l’information disponible au sujet d’un phénomène.
L’échantillon représente une estimation d’un phénomène dans la population et peut être directement mesurable.
Qu’est ce que l’inférence statistique?
L’inférence consiste à tirer une conclusion au sujet des caractéristiques de la population (qui sont inconnues) à partir des caractéristiques de l’échantillon (qui sont connues)
Que veut dire le terme paramètre et le terme statistique?
Le terme paramètre est utilisé pour décrire les caractéristiques de la distribution de la population. (distribution dans un graphique)
Le terme statistique est utilisé pour décrire les caractéristiques d’un échantillon OU de la distribution de la population, par l’intermédiaire d’une inférence.
Les paramètres sont décrits avec des lettres de l’alphabet grec
Les statistiques sont décrites avec des lettres de l’alphabet latin;
Que veut-on dire par caractéristique d’une distribution?
Les caractéristiques de la distribution d’une population ou d’un échantillon sont entre autres sa moyenne, sa variance, son écart-type, son asymétrie et son aplatissement, etc.
Vrai ou faux, une estimation implique une probabilité.
Vrai, d’ailleurs, lorsque nous faisons une estimation, il est possible de faire une erreur : une erreur d’inférence.
Vrai ou faux, les statistiques issues de l’échantillon permettent de faire une inférence au sujet des paramètres de la population
vrai
Vrai ou faux, la distribution d’un échantillon représentatif devrait ressembler à la distribution de la population (au niveau de la forme et les caractéristiques de la distribution)
vrai
Nomme une incertitude permanente associé aux échantillons.
Ce ne sont pas toutes les personnes concernées d’une population qui sont prises en considération.
Nomme 3 critères de validité de l’échantillon.
- La taille de l’échantillon
- Le critère de la chance égale
- Le critère de l’indépendance des réponses
Qu’est ce que le critère de la chance égale?
Le fait que chaque individu de la population a une chance égale d’être choisie
Vrai ou faux, la relation entre la taille de l’échantillon et la représentativité n’est pas linéaire
Vrai
Qu’est ce que l’indépendance des réponses (des scores)?
La réponse d’une personne ne peut pas être influencée par la réponse d’une autre personne
ex : Le vote secret VS le vote à main levée en présence d’un dictateur
Quelle signe représente la moyenne, l’écart - type et la variance?
moyenne : µ / X (avec barre en haut)
écart - type : rond / ou S
variance : rond 2 / s2 (au carré)
Les formules de l’écart - type en statistique et des paramètre sont différente à cause du n - 1, qu’est ce que ça représente?
Le degré de liberté, La division par 𝑛 − 1 produit un estimé non biaisé de l’écart-type de la population (rond) à partir de l’écart-type de l’échantillon (s) étant donné que :
1. variance de l’échantillon est plus petite que la variance de la population puisque l’échantillon exclue bcp de score extrême. n – 1 compense ce biais en exagérant légèrement la variance de l’échantillon, ce qui produit une meilleure estimation de la variance de la population.
L’inférence statistique exige le respect du critère d’indépendance pour toutes les observations d’une distribution. Pourtant, il y a une des différences qui n’est jamais indépendante, quelle est la solution?
Pour estimer la variance sans biais, nous retirons une observation, toutes les observations restantes sont maintenant indépendantes, telles que l’exige la règle de la randomisation.
Vrai ou faux, la correction fait par les degrés de liberté est extrêmement importante lorsque les échantillons sont de petite taille
Vrai