module 8 Flashcards

(55 cards)

1
Q

Quelle analyse statistique permet d’évaluer l’interaction entre trois VA catégorielles ?

A

L’analyse des modèles log-linéaires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vrai ou faux ? Contrairement à l’approche par modèles log-linéaire, un test du Khi 2 d’indépendance consiste à décomposer la relation entre les VAs catégorielles en effets principaux et en effets d’interaction.

A

Faux

Contrairement au test du Khi 2 d’indépendance, l’approche par modèles log- linéaire consiste à décomposer la relation entre les VAs catégorielles en effets principaux et en effets d’interaction (un peu comme l’ANOVA factorielle).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qui suis-je ? Nous élaborons une série de modèles que l’on compare sur le plan de leur capacité à expliquer les données observées.

A

Les modèles log-linéaires

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vrai ou faux ? L’objectif principal de l’approche des modèles log-linéaires consiste à tester la relation entre 2 VA catégorielles ou plus.

A

Vrai

En cela ils se comparent au test du Khi 2 d’indépendance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vrai ou faux ? L’approche des modèles log-linéaires analysent les moyennes de fréquences présentées dans des tables de contingence.

A

Faux

L’approche des modèles log-linéaires analysent les fréquences présentées dans des tables de contingence. (ce qui la compare au Khi 2d’indépendance)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux ? La statistique d’un test log-linéaires suit une distribution de Khi 2.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vrai ou faux ? L’approche des modèles log-linéaires consiste à vérifier si un effet est statistiquement significatif.

A

Faux

C’est l’approche des tests de Khi 2 d’ajustement et d’indépendance (qui consiste à vérifier si un effet est statistiquement significatif).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vrai ou faux ? L’approche des modèles log-linéaires consiste à comparer des modèles statistiques en ce qui a trait à leur capacité à bien expliquer les données.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vrai ou faux ? La statistique Khi 2 des modèles log-linéaires est calculée de la même façon que celles des tests de Khi 2 d’ajustement et d’indépendance.

A

Faux

La statistique Khi 2 des modèles log-linéaires n’est pas calculée de la même façon que celles des tests de Khi 2 d’ajustement et d’indépendance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les postulats de base des modèles log-linéaires?

A
  • Les observations sont indépendantes les unes des autres.
  • Les observations sont identiquement distribuées.

• Les fréquences observées sont assez élevées.
– Il ne doit pas y avoir de 0 dans la table de contingence.
– Si possible, il faut que les fréquences attendues soient plus grandes que 5 dans toutes les cellules.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qui suis-je ? Je suis une approche où on compare des modèles statistiques entre eux en ce qui a trait à leur capacité à expliquer les données observées (fréquences observées).

A

Modèle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qui suis-je ? Je suis le logarithme des fréquences attendues qui est modélisé.

A

Log

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qui suis-je ? Nous modélisons le logarithme des fréquences attendues comme étant une combinaison linéaire d’effets principaux et d’effets d’interaction des VA catégorielles dans notre ensemble de données.

A

Linéaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qui suis-je ? Je suis une représentation mathématique de la manière par laquelle des données sont générées aléatoirement. Je permets de décrire les données observées et prédire celles qui ne l’ont pas encore été.

A

Modèle statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vrai ou faux ? En statistique, les modèles constituent une approximation (ou simplification) d’une réalité complexe.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel est le but des modèles statistiques ?

A

Le but est de réduire une réalité complexe à quelque chose de plus facile à manipuler et conceptualiser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quel est le but d’analyse des modèles log-linéaires ?

A

Le but de l’analyse est de trouver un modèle statistique qui permet de prédire adéquatement les fréquences attendues d’une table de contingence avec plusieurs dimensions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Sachant qu’il existe beaucoup de façons par lesquelles les VA catégorielles peuvent varier ou s’influencer mutuellement, chaque patron potentiel de relations correspond à un _______ _______ .

A

Chaque patron potentiel de relations correspond à un modèle différent.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qui suis-je ? Je suis l’opération inverse de la mise en exposant.

A

Le logarithme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qui suis-je ? Je suis le modèle le plus complet qui peut être considéré. Je comprend toutes les relations possibles (tous les effets principaux et les effets d’interaction).

A

Le modèle saturé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou faux ? Les fréquences attendues selon le modèle saturé sont égales aux fréquences observées.

A

Vrai

Étant donnée qu’il comprend toutes les relations possibles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Qui suis-je ? Je suis le patron d’interdépendance entre toutes les variables.

A

Le modèle saturé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Parmi les choix suivants, lequel ne désigne pas un postulat de base de l’approche par modèles log-linéaires?

a) Les observations sont indépendantes les unes des autres.
b) Les observations sont identiquement distribuées.
c) La distribution commune des observations est la loi normale.
d) Le nombre d’observations doit être suffisamment élevé.

A

c) La distribution commune des observations est la loi normale.

24
Q

En quoi l’analyse par log-linéaire diffère-t-elle du test khi2 de d’indépendance?

i) Le test de d’indépendance permet de tester la relation entre deux variables catégorielles seulement alors que l’analyse par modèles log-linéaire peut tester la relation entre 3 ou plus variables catégorielles.
ii) L’analyse par modèles log-linéaire n’est utile que pour étudier la relation entre variables dichotomiques (ou binaires) alors que le test de d’indépendance permet de tester la relation entre des variables catégorielles avec 2 ou plus catégories.
iii) Le test de d’indépendance compare les fréquences attendues au fréquences observées alors que l’approche par modèles log-linéaires compare les fréquences attendues au logarithme des fréquences observées.
iv) Le but de l’analyse par modèles log-linéaires est de trouver le modèle le plus parcimonieux possible pouvant expliquer et prédire adéquatement les données alors que le test de d’indépendance sert strictement à tester si deux variables catégorielles sont dépendantes ou indépendantes.

A

– i) et iv)

i) Le test de d’indépendance permet de tester la relation entre deux variables catégorielles seulement alors que l’analyse par modèles log-linéaire peut tester la relation entre 3 ou plus variables catégorielles.
iv) Le but de l’analyse par modèles log-linéaires est de trouver le modèle le plus parcimonieux possible pouvant expliquer et prédire adéquatement les données alors que le test de d’indépendance sert strictement à tester si deux variables catégorielles sont dépendantes ou indépendantes.

25
En quoi l’approche par modèles log-linéaires est semblable aux ANOVAs? a) Les deux approches tentent d’expliquer une variable dépendante en fonction d’effets principaux et d’interactions. b) Les deux approches supposent que la variable modélisée (les fréquences attendues ou les moyennes) a une relation linéaire avec les effets à l’étude. c) Pour les deux approches, il est possible de trouver un modèle qui explique parfaitement les données.
a) Les deux approches tentent d’expliquer une variable dépendante en fonction d’effets principaux et d’interactions.
26
Vrai ou faux ? Chaque modèle d’une analyse par modèles log-linéaire correspond à un patron potentiel de relations entre les variables catégorielles à l’étude.
Vrai
27
Vrai ou faux ? Avec une ANOVA, il est possible de trouver un modèle qui explique parfaitement les données.
Faux Il n’y a pas de modèles saturés avec les ANOVAs.
28
Vrai ou faux ? Les modèles linéaires supposent que la relation entre les effets et le logarithme des fréquences attendues est linéaire.
Vrai
29
La statistique des tests modèle log-linéaire correspond à une somme de différences entre les fréquences observées et les fréquences attendues
Vrai | tout comme le test Khi 2 d'indépendance
30
Vrai ou faux ? Il ne doit pas avoir de 0 dans la table de contingence des modèles log-linéaires.
Vrai Si possible, il faut que les fréquences attendues soient plus grandes que 5 dans toutes les cellules Ce qui illustre un des postulats des modèles log-linéaires (celui que les fréquences observées doivent être assez élevées).
31
Vrai ou faux ? L’approche des modèles log-linéaires consiste à comparer des modèles statistiques en ce qui a trait à leur capacité à bien expliquer les données.
Vrai Et non vérifier si un effet est statistiquement significatif (à l'instar des test Khi2 d'ajustement et d'indépendance).
32
Vrai ou faux ? En statistique, les modèles constituent une approximation (ou simplification) d’une réalité complexe.
Vrai
33
Vrai ou faux ? Les modèles statistiques constituent une description mathématique de la manière par laquelle des données sont générées aléatoirement.
Vrai
34
Vrai ou faux ? Les modèles statistiques ne permettent pas de prédire les données; ils permettent seulement de décrire les données qui ont été observées.
Faux Les modèles statistiques permettent de décrire les données qui ont été observées ainsi qu’à prédire celles qui ne l’ont pas encore été
35
Vrai ou faux ? Le but des modèles statistique est de réduire une réalité complexe à quelque chose de plus facile à manipuler et conceptualiser
Vrai
36
Vrai ou faux ? L'ANOVA et l'approche par modèles log-linéaires se compare dans la mesure que : - les deux supposent que la variable modélisée (les fréquences attendues ou les moyennes) a une relation linéaire avec les effets à l’étude.
Faux L'ANOVA suppose que la relation entre les fréquence attendues (c.-à-d. les moyennes) et les effets (à l'étude) est linéaire. L'approche par modèles log-linéaires suppose que la relation entre les effets et le LOGARITHME des fréquences attendues est linéaire.
37
Vrai ou faux ? L'ANOVA et l'approche par modèles log-linéaires se compare dans la mesure que : - il est possible de trouver un modèle qui explique parfaitement les données.
Faux Il n'existe aucune modèles saturés avec les ANOVAs
38
Qui suis-je ? Je suis l’indice qui mesure à quel point les fréquences attendues selon un modèle donné sont différentes des fréquences observées.
La déviance
39
Pourquoi est-il impossible de trouver un modèle étant mieux ajustés aux fréquences observées que le modèle saturé? a) Parce que le modèle saturé a le plus de degrés de liberté. b) Parce que les fréquences attendues du modèle saturé sont les fréquences observées dans l’échantillon. c) Parce que les fréquences attendues du modèle saturé sont moins élevées que celles de tous les autres modèles.
b) Parce que les fréquences attendues du modèle saturé sont les fréquences observées dans l’échantillon.
40
Vrai ou Faux? Le fait d’enlever un effet à modèle log-linéaire revient à lui imposer une contrainte supplémentaire.
Vrai
41
Quel est le test statistique employé afin de vérifier si un modèle explique significativement moins bien les fréquences attendues que le modèle lof-linéaire? a) Le test de déviance. b) le test de de Pearson. c) le test de d’indépendance. d) le test de de vraisemblance.
d) le test de de vraisemblance.
42
Supposons que nous voulions effectuer une analyse par modèles log-linéaires de trois variables catégorielles A, B et C. Parmi les modèles écrits en notation hiérarchiques suivants, lequel désigne celui qui comporte tous les effets principaux ainsi que l’interaction entre B et C? a) (A,B,C) b) (A,BC) c) (ABC) d) (AB,BC,AC)
b) (A,BC)
43
Quel est l’objectif principal de la méthode pas à pas dans l’analyse log-linéaire? a) Trouver le modèle log-linéaire dont les fréquences attendues sont le plus proche possible des fréquences observées. b) Trouver le modèle log-linéaire le plus parcimonieux possible expliquant tout de même adéquatement les données (dont la déviance n’est pas statistiquement significative). c) Déterminer quelle variable catégorielle à l’étude explique le mieux les données. d) Déterminer quelles fréquences attendues diffèrent significativement des fréquences observées.
b) Trouver le modèle log-linéaire le plus parcimonieux possible expliquant tout de même adéquatement les données (dont la déviance n’est pas statistiquement significative).
44
Supposons que nous étions en train d’effectuer une méthode pas à pas pour une analyse par modèles log-linéaire de quatre variables catégorielles : G, L, R et P. Après quatre étapes de la méthode pas-à-pas, le modèle sélectionné par l’algorithme est (GL,LRP). Si on effectuait une cinquième étape, quels effets seraient des candidats à la suppression?
GL ou RLP Autrement dit, les effets qui seraient des candidats à la suppression SONT tout simplement l’interaction d’ordre 2 entre les variables G et L, et l’interaction d’ordre 3 entre les variables L, R et P.
45
Giorgio effectue une analyse par modèles log-linéaires d’une table de contingence avec 4 variables catégorielles : O, P, Q et R. Il effectue une méthode pas-à-pas pour trouver le modèle log-linéaire le plus parcimonieux possible. Au cours des six premières étapes, la procédure détermine qu’il est possible d’éliminer l’interaction d’ordre 4, toutes les interactions d’ordre 3 ainsi que l’interaction entre les variables Q et R sans augmenter significativement la déviance. À la septième étape, la procédure détermine qu’il n’est plus possible d’enlever d’effet sans affecter significativement la capacité du modèle sélectionné à expliquer adéquatement les fréquences observées. Quel est le modèle final sélectionné par la procédure (veuillez le rapporter en notation hiérarchique).
(OP, OQ, OR, PQ, PR)
46
Qui suis-je ? Je suis un patron d’interdépendance entre toutes les variables.
Modèle saturé
47
Pourquoi le modèle saturé est parfaitement ajusté aux | données ?
Parce que les fréquences attendues du modèle saturé sont les fréquences observées.
48
Vrai ou faux ? Selon la méthode pas à pas, si le fait d’enlever l’effet du modèle ne nuit pas significativement, on continue l’analyse en tentant d’enlever un autre effet au modèle.
Vrai
49
Si le fait d’enlever l’effet du modèle nuit significativement, on ________ l’analyse.
Le modèle sélectionné final sera celui auquel il n’était plus possible d’enlever d’effet.
50
Quel est l'objectif de la méthode pas à pas ?
L’objectif est alors de déterminer si les fréquences attendues (découlant du modèle moins un terme) sont significativement différentes de ce qui a été observé.
51
Qui suis-je ? Je suis le manque d’ajustement des fréquences attendues par rapport aux fréquences observées (dans la méthode pas à pas).
La déviance
52
Vrai ou faux ? (Dans la procédure pas à pas) avant d’arrêter notre choix de manière définitive, il faut effectuer les vérifications suivantes: * Il faut s’assurer que la déviance du modèle retenu par rapport au modèle saturé n’est pas significativement plus grande que 1. * Il faut s’assurer qu’aucune des fréquences attendues n’est égale à 0 et que pas plus que 20% des fréquences attendues sont plus petites que 10.
Faux * Il faut s’assurer que la déviance du modèle retenu par rapport au modèle saturé n’est pas significativement plus grande que 0. * Il faut s’assurer qu’aucune des fréquences attendues n’est égale à 0 et que pas plus que 20% des fréquences attendues sont plus petites que 5.
53
Vrai ou faux ? Le test de khi 2 d'indépendance teste si la déviance du modèle est significativement plus élevée que 0.
Faux Vrai ou faux ? Teste de khi 2 d'indépendance teste si la déviance du modèle est significativement plus élevée que 0.
54
Qui suis-je ? Je suis les tests qui détermine si les effets dans le modèle retenu (par la méthode pas à pas) sont statistiquement significatifs.
Les tests d’associations partielles
55
Qui suis-je ? Je suis la table de contingence calculée pour un sous-ensemble des facteurs étudiés
la table de contingence marginale