Cours 4 Flashcards
(112 cards)
C’est quoi le concept d’inférence statistique?
C’est un concept fondamental qui nous permet de tirer des conclusions
C’est quoi les concepts abordées dans l’inférence statistiques
Population et échantillon
Échantillons aléatoire
Paramètres vs statistiques
Hypothèse nulle et hypothèse alternative
Erreur d’échantillonnage
Erreurs d’inférence alpha et bêta
C’est quoi la différence entre la population et l’échantillon ?
La population constitue un groupe complet ou un groupe inaccessible que nous souhaitons connaître (on y a pas accès généralement pcq c trop gros)
L’échantillon consiste en ce que nous connaissons (de quoi on a accès)
Donne moi les caractéristiques d ‘une population.
1- Représente 100 % des informations concernant un phénomène ou un groupe.
2- La population représente LA VÉRITÉ ABSOLUE au sujet d’un phénomène, d’une caractéristique, de la relation entre deux variables, etc.
Pourquoi est ce qu’on dit que la population représente la vérité absolue?
Théoriquement, c’est la vérité, car l’information est obtenue pour toutes les personnes / entités constituant la population. IL FAUT TOUTEFOIS AVOIR UNE MESURE VALIDE ET FIDELE.
Donc en stat c’est quoi la définition de la population?
L’ensemble des personnes / entités auxquelles s’appliquent les conclusions d’une recherche ou d’une analyse. ( en termes statistiques, c’est l’ensemble d’unités généralisé par un modèle statistique, l’échantillon)
C’est quoi la différence entre le Recensement et le sondage?
Recensement: lorsqu’on prend une mesure a partir d’une population
Sondage: lorsqu’on prend une ensure a partir d’un échantillon
Qui définie la population?
La population doit être définie par le chercheur (il n’existe pas de population a priori)
Est il possible de mesurer une population, sinon, pourquoi?
Non, il est quasi impossible de mesurer une population a cause du coût, ressources, temps, accessibilité.
C’est quoi la définition en stat de l’échantillon ?
C’est l’information disponible au sujet d’un phénomène (sur une parcelle des membres de la population)
C’est quoi la définition de l’inférence statistiques ?
L’inférence consiste à tirer une conclusion au sujet des caractéristiques de la population (qui sont inconnus) a partir des caractéristiques de l’échantillon (qui sont connus)
C’est quoi la différence entre paramètre et statistique?
Paramètre: Caractéristiques de la distribution de la population
Statistique: Caractéristiques d’un échantillon ou de la distribution de la population par intermédiaire de l’inférence.
Donne moi des exemples de caractéristiques de la distribution dune population.
Moyenne, variance, écart type, asymétrie, aplatissement
Les paramètres et les statistiques sont décrits avec quel alphabet?
Paramètre= alphabet grec
Statistiques= alphabet Latin
Donc grâce a ces concepts, c’est quoi la définition complète de l’inférence statistique?
L’inférence consiste à estimer les paramètres (caractéristiques de la population) à partir des statistiques (les caractéristiques de l’échantillon)
Est ce qu’il est possible de faire une erreur grâce a L’inférence statistiques?
Oui, un estimé implique toujours une probabilité. Donc quand on fait une estimation, il est possible de faire une erreur (erreur d’inférence)
Qu’est ce qu’il faut pour qu’on considère qu’un échantillon est représentatif?
Il faut que les caractéristiques de l’échantillon soient similaires a celles que l’on retrouve dans la population (la distribution d’un échantillon représentatif devrait ressembler a la distribution de la population)
Pourquoi c’est utile un échantillon représentatif ?
Économie de temps, d’argent et d’énergie
Est ce qu’on est sûre de la valeur des conclusions de l’étude réalisée a partir d’un échantillon ?
Il ya tjrs une incertitude permanente (car ce n’est pas toutes les personnes concernées d’une population qui sont interrogées)
Qu’est ce qu’on peut faire pour diminuer l’incertitude ?
D’où l’importance que l’échantillon sois représentatif
C’est quoi les caractéristiques qui servent à évaluer la représentativité?
Les caractéristiques servant à évaluer la représentativité sont tribu aires du concept à évaluer (sexe, âge, origine)
Lorsqu’on connaît pas les paramètres (ex: très grande population), comment on constitue un échantillon représentatif?
Il faut utiliser l’échantillon aléatoire (grâce aux lois du hasard, l’échantillon sera la représentativité la plus fidèle de la population s’il contient un nombre suffisamment grand d’observations)
C’est quoi les critères importants dans l’échantillon aléatoire ?
1- critère de la chance égale (randomisation, tout le monde a la meme chance d’être choisis)
2- critère de l’indépendance des réponses (la réponse d’une personne ne doit pas être influencée par la réponses d’une autre personne)
Donne moi des exemples ou le critère de l’indépendance des réponses n’est pas respecté?
1- vote a main levée
2- deux personnes d’une meme famille dans l’échantillon / un couple