Analyse statistique de données Flashcards
(33 cards)
Qu’est-ce que les statistiques ?
- Discipline qui s’intéresse à l’analyse quantitative de la réalité.
Qu’est-ce qu’un paramètre ?
- Calcul effectué sur la population (vraie valeur dans la population ; presque toujours inconnu).
Qu’est-ce qu’un indice statistique ?
- Calcul sur l’échantillon pour estimer le paramètre.
Qu’est-ce qu’une analyse inférentielle ?
- Tests statistiques permettant d’estimer les caractéristiques de la population telles qu’elles sont mesurées à partir de sous-ensembles (échantillons).
- S/√n : écart type divisé par la racine du nombre de personne de l’échantillon.
Qu’est-ce qu’une statistique descriptive ?
- On ne fait que décrire les résultats.
Quelle est l’objectif des statistiques ?
- Représenter un grand nombre de données sous forme d’un ou de quelques nombres (ex. : moyenne).
- Généraliser aux populations les caractéristiques mesurées à partir d’échantillons.
- Prendre des décisions (ex. : faire une thérapie avec 1 groupe témoin et vérifier s’il y a une différence).
Qu’est-ce qu’une stratégie d’analyse ?
- Avant de procéder à la cueillette de données on doit décider du ou des tests statistiques à utiliser.
- Nécessite que la question de recherche et les hypothèses soient clairement définies
- Un critère fondamental qui guide le choix du test est l’échelle de mesure des variables impliquées
- Il faut également bien déterminer le nombre de groupes à l’étude et tenir compte du plan de recherche.
Qu’est-ce qu’une analyse descriptive et quelles sont les principaux indices statistiques qui nous intéressent?
- Permet de synthétiser les données en faisant ressortir comment les données se distribuent.
- Indices de tendances centrales (moyenne, médiane, mode)
- Indices de dispersion (étendue, variance, écart-type)
- Indices de distribution (fréquences, asymétrie, aplatissement)
Quelles sont les indices de tendance centrale ?
- Moyenne : Additionner tous les éléments d’un ensemble et diviser par le nbre d’éléments additionnés.
- Médiane : Point milieu d’un ensemble ordonné de données.
- Mode : Valeur qui a la fréquence la plus élevée, celle qui est endossée par le plus de participants.
Quelles sont les indices de dispersion ?
Étendu :
- Écart entre la valeur la plus petite et la valeur la plus grande.
Variance :
- Variabilité de la distribution de donné. Somme (écarts à la moyenne)*2 / N-1.
Écart-type :
- Distance entre chaque donnée et la moyenne dans un ensemble de données (conserve unité de la variable car √variance)
Quelles sont les types d’étude de la distribution ?
- Distribution de fréquence.
- Aplatissement de la distribution (kurose)
- Asymétrie de la distribution.
Qu’est-ce qu’une analyse inférentielle ?
- Presque toujours avec des échantillons.
- À l’aide de la statistique inférentielle, il est possible d’inférer la valeur d’une variable dans la population à partir de la mesure de cette variable prise dans l’échantillon.
- Par convention, on fixe à 5% le risque toléré que ce soit due au hasard.
Qu’est-ce qu’un test one-tail (unilatéral) ?
- Avec une direction (ex. : tel groupe sera meilleur que l’autre).
- Avantage : on a déjà donné une direction donc on peut tester pour 5% d’un seul côté de la courbe (plus facile d’obtenir une différence statistiquement significative).
Qu’est-ce qu’un test two-tail ?
- Sans direction (ex. : il y aura une différence significative entre tel groupe et tel groupe).
- On doit diviser le 5% de chaque côté de la courbe (2,5% de chaque côté)
- Faire lorsqu’on a une recension des écrits très contradictoire (étude qui penche de chaque côté).
Quand est-ce qu’on utilise la table t ?
- Utiliser pour les petits échantillons (en bas de 30).
Qu’est-ce qu’une erreur de type 1 et de type 2 et laquelle est la plus grave ?
- Type 1 : Rejet de H0 alors que H0 est vraie.
- Type 2 : Non rejet de H0 alors que c’est faux.
- Erreur de type 1 est la plus grave parce qu’elle envoie des chercheurs et intervenant dans une mauvaise direction.
Qu’est-ce que Ho et H1 ?
- H0 = hypothèse nulle ;
- H1 = hypothèse alternative
Qu’est-ce que la puissance d’un test ?
- 1 - erreur de type 2.
Qu’est-ce que la démarche du test d’hypothèse ?
- Pour une hypothèse donnée, formuler H0 et H1.
- Identifier échelles de mesure des variables.
- Choisir le test statistique à effectuer.
- Effectuer le calcul statistique approprié.
- En fonction du résultat, prendre la décision de rejeter ou non H0.
- Interpréter la signification de cette décision.
- Dire si votre hypothèse de recherche est confirmée.
Quelles sont les différents test statistiques ?
- Corrélation: 2 variables continues
- Test t: 2 groupes et une variable continue
- Test t apparié: une variable continue mesurée deux fois
- Analyse de variance: 3 (et +) groupes et une variable continue
- ANOVA à deux facteurs: deux variables nominales (facteurs) ou + et une variable continue
- Khi-deux: deux variables nominales
Qu’est-ce que la corrélation de pearson ?
- Lorsqu’on veut mettre en relation 2 variables continues
- On s’intéresse au sens (+ ou -) ainsi qu’à à la force du lien (faible, modéré, fort).
Exemple d’hypothèse de corrélation ?
Il y a un lien positif entre le nbre d’heure d’activité physique et le score de bien-être physiologique.
- H0: Il n’y a pas de lien ou un lien négatif entre heures d’activité physique et score de bien-être psychologique
- H1: Il y a un lien positif entre nombre d’heures d’activité physique et score de bien-être psychologique
- Si on rejette H0, on accepte H1 = test significatif.
Qu’est-ce que le test-t non pairé ?
- Lorsqu’on veut comparer 2 groupes sur une variable continue (1 variable nominale dichotomique et 1 variable intervalle/rapport).
- Important de présenter les moyennes de chaque groupe pour interpréter le résultat le groupe expérimental (M = 13,1) présente un score de dépression inférieur à celui du groupe témoin (M = 24,5).
Exemple d’hypothèse test-t non pairé ?
Ex. d’hypothèse : Le groupe expérimental a un score de dépression inférieur à celui du groupe témoin.
- H0: Le groupe expérimental a un score de dépression semblable ou supérieur à celui du groupe témoin
- H1: Le groupe expérimental a un score de dépression inférieur à celui du groupe témoin.