5_Intro aux analyses stats Flashcards
Pourquoi faire des analyses statistiques ?
Déterminer :
- Fiabilité d’un appareil à mesurer…
- La valeur normale de…
- Traitement A est-il plus efficace que traitement B ?
- Prise régulière de… réduit risques de …. ?
= Pour faire confiance aux chiffres que nous voyons et seuil scientifique acceptable (Statistiquement significatif)
Comparer objectivement : valides ? fiables ? variabilité parmi données recueillies ?
Tester sur un nbr d’essais conséquent pour tirer conclusions, pas juste 1 individu (représentatif ensemble pop.)
Variabilité, ex: 0-5-10 et 4.9-5-5.1 = même moyenne mais pas même variabilité
Si t-test < 0,05…
différence est SIGNIFICATIVE
Qu’est-ce que la statistique ?
Définition : Branche des maths appliquées : étude des phénomènes mettant en jeu un grand nbr d’éléments
- Ensemble de données concernant l’état ou l’évolution d’un phénomène qu’on étudie au moyen de la statistique (au sens ci-dessus) OU
- Ensemble des méthodes permettant d’obtenir et d’analyser (traiter) des informations (données)
- Utilisent mathématiques et informatique pour leur mise en œuvre
- Données : observations collectées, on va faire une entrée de donner et en faire un nettoyage
En résumé
= Science de la variabilité
= Répondre à une question scientifique, en tirer des conclusions et la généraliser à la pop
Homogène ou disparate (ex : masse corporelle d’une population)
- Écart type, donc variabilité
- 2 moyennes identiques + 2 variabilités différentes = donne résultat et analyse différente !!
Biologie humaine ou anthropométrie
science non exacte
ex : Tous les étudiants n’ont pas la même masse corporelle
Variabilité
STATISTIQUES DESCRIPTIVES
STATISTIQUES INFÉRENTIELLES
MODÉLISATION STATISTIQUE
STATISTIQUES DESCRIPTIVES
La variabilité implique de la confusion. Quelle information concise et utile peut-on extraire de ces données ? Comment décrire la variabilité ?
STATISTIQUES INFÉRENTIELLES
La variabilité implique de l’incertitude. Sachant que les personnes d’un même programme ont des masses différentes, qu’est-ce qui nous permet d’affirmer que les personnes d’un autre programme d’étude auront des masses corporelles comparables? Jusqu’à quel point peut-on généraliser les résultats d’une expérience ? Comment inférer (tirer des conclusions) en présence de variabilité ?
MODÉLISATION STATISTIQUE
La variabilité implique des questions scientifiques. L’un des buts de toute science est d’identifier les sources de variabilité afin d’être en mesure de prédire (voire même de modifier) les phénomènes étudiés. Pourquoi certaines personnes sont plus massives que d’autres ? Quelle masse atteindra une personne dans de telles conditions? Comment prédire la variabilité ?
Inférence statistique
Méthodes permettant de généraliser à une population les conclusions tirées des résultats obtenus à partir d’un échantillon. Utilise le calcul des probabilités
*utiliser info prélevée sur un échantillon pour tirer des conclusions sur un paramètre de la population
Se fait sur la base de divers tests statistiques
Si info provient d’un échantillon
faire inférences + tirer conclusions sur paramètres de la population
*on ne possède qu’un échantillon de la population sans connaître nécessairement la population et on s’intéresse à la population (à un paramètre de la population) = inférence statistique = info prélevée pour tirer des conclusions sur paramètre d’une population
Si info NE provient PAS d’un échantillon
utiliser données de recensement et analyser données en main
Paramètre VS statistique
Paramètre :
- décrit population
- entités réelles
- fixe (mais souvent inconnue)
- Ex: La moyenne (µ) dans une population est un paramètre
Statistique :
- mesure à partir échantillon
- estimation d’un paramètre
- varie d’un échantillon à l’autre
- Ex: La moyenne ( x ) dans un échantillon est une statistique
Population
Ensemble des individus d’intérêt d’une étude (patients, plantes, insectes) avant d’entreprendre une étude ou une expérience
Définir autant précisément que possible QUI nous intéresse
Individu
Unité statistique, élément
Membre de la population étudiée
Variable
Caractéristique d’intérêt mesurable sur les individus de la population (âge d’un patient, hauteur après une culture de six mois d’un Onobrychis, pile ou face, résultat du lancer d’une pièce de monnaie)
Définir QUOI nous intéresse
Taille
Effectif total, nbr d’individus (éléments) concernés par l’étude
Données
Ensemble de mesures/observations concernant l’état/évolution d’un phénomène.
Valeurs prises par une ou plusieurs variables sur un certain nbr d’individus
Échantillon + ses types
Partie ou sous-ensemble prélevé d’une population
• Échantillon représentatif
Contient toutes les caractéristiques de la population (population-mère).
• Échantillon biaisé
Ne renferme pas toutes les caractéristiques de la population
• Échantillon aléatoire
Ses éléments ont été choisis au hasard.
• Échantillon aléatoire simple (EAS)
Chaque unité a une chance égale d’être choisie.
But de l’échantillonnage
Recueillir de l’information en vue d’un jugement, appréciation ou décision :
inférence : on s’intéresse à une population, mais on ne dispose que d’un échantillon
Info sur l’échantillon soient pertinentes, fiables, représentatives et non biaisées !
Méthodes d’échantillonnage
- Scientifiques (probabiliste)
- Non-Scientifiques (non-probabiliste)
Non-Scientifiques (non-probabiliste)
- Échantillonnage accidentel (par convenance)
- Échantillonnage par quotas
- Échantillonnage intentionnel
- Échantillonnage par réseaux
Échantillonnage accidentel (par convenance)
o interview des clients, choisir des personnes selon leur accessibilité dans un lieu déterminé et à un moment précis
o couramment utilisé
Échantillonnage par quotas
o sélection de sous-groupes proportionnellement à leur nombre dans la population
o (ex : origine ethnique)