Cours 10 - Modélisation Flashcards by Charles Caron

Une modélisation applique une ______ ____________ aux données d’une étude pour décrire la relation entre une ____________ et la survenue d’un __________.

Une modélisation applique une ÉQUATION MATHÉMATIQUE aux données d’une étude pour décrire la relation entre une EXPOSITION et la survenue d’un ÉVÉNEMENT.

How well did you know this?

Not at all

Perfectly

Quelles sont les deux fonctions primaires pour lesquelles est utilisée la modélisation ?

Prédiction (estimation du risque)

Contrôle des confondants (évaluer le rôle causal en contrôlant pour la confusion)

How well did you know this?

Not at all

Perfectly

V ou F

La modélisation permet de contrôler de façon simultanée l’influence de plusieurs confondants

How well did you know this?

Not at all

Perfectly

V ou F
Dans une équation linéaire de forme Y = a0 +a1X, le paramètre a0 représente l’ordonnée à l’origine (intercept) ce qui représente graphiquement l’endroit où la droite traverse X = 0 (ordonnée)

En fait, l’intercept permet d’estimer le nombre d’événements survenus SANS EXPOSITION. Toutefois, elle diffère de la valeur réelle du graphique.

How well did you know this?

Not at all

Perfectly

Soit une situation où des patients exposés à X sont à risque de subir l’événement Y.

La droite Y = 2.6 + 1.2X traduit la situation.

Que signifie 1.2 ?

C’est la pente de la droite. Ça représente l’estimation de la variation de survenue de l’événement pour une augmentation d’une unité de X.

How well did you know this?

Not at all

Perfectly

V ou F

Il est possible de calculer des mesures d’association à partir d’une régression linéaire

On n’a qu’à comparer les valeurs Y d’une droite pour deux valeurs de X données.

How well did you know this?

Not at all

Perfectly

Les modèles généralisés peuvent être utilisés comme alternative à quoi pour contrôler la confusion ?

La stratification

How well did you know this?

Not at all

Perfectly

V ou F
Un modèle généralisé où on contrôle pour les confondants procure une valeur NON BIAISÉE pour chacun des facteurs inclus dans le modèle

How well did you know this?

Not at all

Perfectly

Pourquoi cherche-t-on parfois à effectuer une transformation d’un modèle ?

Pour éviter que le modèle traduise une situation impossible (ex. un nombre négatif d’événement)

How well did you know this?

Not at all

Perfectly

Qu’est-ce qu’on peut utiliser comme transformation pour que la variable Y ne prenne que des valeurs positives ?

On peut utiliser une transformation logarithmique. (On utilise souvent ln)

How well did you know this?

Not at all

Perfectly

Quel calcul mathématique complexe utilise-t-on pour obtenir la valeur réelle de la variable Y si elle a été transformée en logarithme naturel ?

Y = e^équation

Donc on a

ln(Y) = A0 + A1X1 + … + AkXk

Y = e^[A0 + A1X1 + … + AkXk]

How well did you know this?

Not at all

Perfectly

Si on fait face à une mesure dichotomique de l’exposition (oui = 1 ou non = 0), Comment peut-on estimer la différence de taux entre les exposés et non-exposés ?

On peut l’estimer par l’équation Ye - Yne

Ou on peut utiliser A1 qui représente la pente dans un modèle linéaire simple. (Y = A0 + A1X)

How well did you know this?

Not at all

Perfectly

Quelle est l’équation de la DIFFÉRENCE DE TAUX dans un modèle généralisé transformé en logarithme naturel où l’exposition est dichotomique

On a déjà vu que la différence de taux pour une exposition dichotomique est

Ye - Yne = A1

Donc le logarithme naturel de ça sera

ln (Yexp) - ln (Ynexp) = A1

How well did you know this?

Not at all

Perfectly

Transformez cette équation en antilogarithme

ln(Ye) - ln(Yne) = A1

Ye/Yne = e^A1

Ainsi, quand on se ramasse avec une transformation en LOG et qu’on veut estimer une différence de taux, on se retrouve à plutôt estimer un RATIO

How well did you know this?

Not at all

Perfectly

Dans les cas où la variable dépendante serait une mesure de risque comprise entre 0 et 1, quelle transformation devrait-on utiliser ?

Une transformation logistique

How well did you know this?

Not at all

Perfectly

Quelles sont les deux étapes d’une transformation logistique ?

Study These Flashcards

Convertir la mesure du risque R (allant de 0 à 1) en cote de risque (avec l’équation R/(1-R)
Convertir la cote du risque (allant de 0 à l’infini) en logit (allant de - infini à + infini) –> ln[R/(1-R)].

V ou F

R/(1-R) représente le risque d’événement divisé par le risque de non-événement

Study These Flashcards

Quelle équation obtient-on lors d’une transformation logistique ?

Study These Flashcards

ln[R/(1-R)] = A0 + A1X

V ou F
Dans une transformation logistique où l’exposition est dichotomique, le ratio des logits exposé/non-exposé correspond à e^a1

Study These Flashcards

Il correspond à A1

Si on fait l’antilogarithme pour obtenir les valeurs réelles du risque, e^A1 correspond au RC

V ou F

On peut obtenir des différences de risque avec une transformation logisitque

Study These Flashcards

On ne peut obtenir que des RC.

C’est pourquoi toute transformation effectuée sur un modèle mathématique CONDITIONNE le type de mesure estimée

Soit l’équation logistique

Nombre de petites à T-Bud = 0.18 + 2.1Âge de la petite.

Faites l’interprétation du coefficient de l’âge de la petite

Study These Flashcards

e^1.2 = 3.32

Pour chaque augmentation d’un an de l’âge de la petite, la cote du nombre de petites à T-Bud augmente de 232 %.

Un des principaux avantages des modèles de régression multivariés est la facilité avec laquelle les ____________ peuvent être contrôlés

Study These Flashcards

Confondants

V ou F

Les analyses stratifiées offrent plus d’information que des analyses multivariées

Study These Flashcards

Dans l’analyse stratifiée, on peut voir la distribution des données

Quelle analyse est la plus performante ? Multivariée ou stratifiée ?

Study These Flashcards

Multivariée! Elle donne toutefois moins de détails et ne devrait pas être utilisée comme outil principal mais plutôt pour appuyer l’analyse stratifiée.

V ou F | La modélisation permet d'identifier les variables causales

F Bien qu'on puisse mettre plein de variables dans un modèle, aucune distinction ne se fait entre les associations causales et les autres variables

Quelles sont les 4 étapes de la stratégie d'analyse ? ouf...

1. Examination (on examine les données, les variables, les associations simples, analyses stratifiées simples pour voir si tout fonctionne) 2. Détermination des confondants 3. Forme de la relation entre l'exposition et l'issue de santé 4. Interaction causale

Combien devrait-il y avoir d'observation par variable pour éviter le sur-ajustement ?

10 à 15. 10-15 événement et 10-15 non-événement par variable.

Qu'est-ce que provoque le sur-ajustement ?

Le sur-ajustement augmente l'effet de l'erreur aléatoire

Quand on a pas assez d'observations pour ajuster pour les confondants sans faire de sur ajustement, on peut se tourner vers des scores résumés. Lesquels ?

- Score de risque de maladie | - Score de propension (+++)

Cours 10 - Modélisation Flashcards

(29 cards)