Longitudinaal Flashcards

(24 cards)

1
Q

begin van longitudinale studie

A
  1. spreiding
    - bij gerandomiseerd zou alle startpunten samen moeten liggen
    - vaak niet het geval = heeft niks met bestudeerd effect te maken
    - 2 opties voor dit probleem
  2. klassieke regressie
    - gewone statistiek uitvoeren
    - initieël verschil toch toeschrijven aan bestudeerd effect
    - slechts enkele punten in de tijd bekijken
    - wilxocon of gepaarde T-test
  3. betere regressie
    - regressie met interactie-effecten
    - onafhankelijksheidsvoorwaarde niet voldaan = correctie nodig
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

attrition

A
  1. MCAR missing completely at random
    - reden is niet gerelateerd aan geobserveerde of niet-geobserveerde data
    - volledig willekeurig
    - bijna nooit het geval
    - listwise deletion = negeren van uitval
  2. MAR missing at random
    - reden is gerelateerd aan andere geobserveerde data
    –> maar niet van de ontbrekende waarde zelf = niet kunnen verklaren
    - multiple imputation = benaderen van gegevens via beschikbare variabelen
    –> zal dichter tegen werkelijkheid liggen dan listwise deletion
  3. MNAR missing not at random
    - direct gerelateerd aan de niet-geobserveerde informatie
    - moeilijkste oplossing = sensitiviteitsanalyses
    –> robustheid van resultaten nagaan
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

voor & nadelen van longitudinale data

A
  1. voordelen
    - toegang to veranderingen binnen individuen over tijd
    - mogelijkheid causale relaties verder bestuderen
    - vermogen om tijdgerelateerde patronen te ontdekken
    –> trends & seizoengebonden variaties
  2. nadelen
    - attrition = uitval van deelnemers
    - complexere analyse door correlatie tussen herhaalde metingen binnen zelfde subjecten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

correlatie

A
  1. probleem
    - typische regressie verondersteld onafhankelijkheid tussen observaties
    - long = geclusterde data
  2. clusters
    - vanaf vermoeden correlatie
    - subgroep van 1 persoon of groter
    - clusters bewegen in zelfde patroon over tijd heen = correlatie
  3. soorten clusters
    - longitudinale data = 1 persoon
    - cross-sectionele = subgroepen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

matrix van correlatie

A
  1. matrix voorstelling van correlatie
    - verschillende methodes voor correlatie in kaart te brengen
    - op X & Y staan de tijdsmomenten
    - diagonaal zal 1 zijn want volledig zelfde waarde
  2. verschillende methodes
    - klassieke regressie = niet-diagonaal zal 0 zijn (geen correlatie)
    - EC = zelfde correlatie tussen verschillende tijdsmomenten
    - AR1 = correlatie is hoger bij dichter gelegen tijdsmomenten
    - statistiek door repeated measures anova = vergelijking van gepaarde groepen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

verschil klassiek model & gemengde modellen

A
  1. voorbeeld
    - noice expoisure tov. hearing impairment
    - in verschillende zones = platteland tot stedelijk = confounder
  2. klassiek
    - onderverdeling negeren
    - foute regressie
    - we hebben geen idee wat hoge waarden in platteland doen & omgekeerd
  3. mixed models = clusteren
    - geen onafhankelijke data = zelfde patronen
    - gelijkaardig aan meervoudige regressie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

random vs fixed effects

A
  1. fixed effects
    - interpretatie zoals klassieke regressie
    - te schatten effect op data
    - gekend gemiddeld verschil ≈ regressievergelijking
  2. random effects
    - onvoorspelbare effecten op data
    - we begrijpen wel dat er een mogelijk effect is
    - effecten worden willekeurig beschouwt
    - afwijkingen van gekend gemiddeld verschil ≈foutenmarge van regressievergelijking
  3. mixed effects model
    - klassieke methode van modellering longitudinale data
    - combinatie van fixed & random effects
    - beter dan repeated measures anova
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

verschil mixed models & repeated measures anova

A
  1. repeated measures anova
    - assumptie van correlatie
    - 10 observaties per parameter nodig = heel snel heel grote steekproef nodig
  2. mixed models
    - geen schatting van correlatie
    - maar 1 parameter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

random intercept model

A
  1. Y = B0 + B1X1 + b0i + eji
    - constante B0
    - B1 = afwijking geassocieerd met X1
    - zelfde rico voor ieder persoon maar verschuiving voor ieder persoon appart
    - opsplitsing van totale fout = random effects
  2. b0i
    - voor elk subgroep = persoon een intercept
    - afijking van subject tov. globale gemiddelde
    –> verschil van individuele regressielijn tov. globale regressielijn
    - combinatie van B0 & B1
  3. residuele fout Eji
    - afwijking van j-de score
    - tov. gemiddelde van individu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

verschil lineaire regressie & andere analyses

A
  1. lineaire regressie
    - werk via OLS ordinairy LEAST squares = kwadratensom
    - afstand geobserveerde data & regressielijn zo KLEIN mogelijk maken
    - determinatie coëfficient
  2. andere analyses = mixed models & logistische regressie
    - MLE MAXIMUM likelihood estimation
    - welke parameters zijn het MEEST waarschijnlijk bij de data
    - regressie-analyse oplossing OLS = MLE
    - nieuwe determinatie coëfficient = L likelihood
  3. L likelihood
    - AIC Akaike Information Criterion
    - AIC = pentalty aan aantal factoren ≈ nagelkerke
    - AIC = 2k - 2ln(L)
    –> lager is beter
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

interpretatie van test

A
  1. eerste tabel ≈ interpretatie zoals lineaire regressie
  2. estimates of covariantie parameters
    - covariantie binnen cluster/individu
    - gelijkaardig aan correlatie maar niet gestandaardiseerd = -1 of +1
    - indien significant = correlatie tussen scores opeenvolgend aan elkaar
    - positief = zit altijd boven de algemene regressielijn
    - negatief = wisselt af tussen boven & onder lijn
  3. rediuele variantie
    - resterende covariantie bij residuele fout = nog kijken naar andere factors
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

correlatie binnen zelfde cluster

A
  1. ICC intraclass correlation
    - % van variantie die verklaard wordt
    - door covariantie van algemene regressielijn
    - B0 / B0 + b0i
    - opsplitsing van totale fout = resterende variantie rond nieuwe lijn

in sps = estimates of covariance parameters
redisual / residual + intercept

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

data verzameling van mixed models

A
  1. breed formaat = klassiek
    - bij gepaarde toesten
    - herhaalde metingen staan naast elkaar
    - meting 1, 2, … zijn apparte variabelen
  2. lang formaat
    - bij regressie-analyses
    - herhaalde metingen zijn categorisch verdeeld
    - parameter hoeveelste meting = categorisch
    - parameter uitkomst = continu
    - in SPSS omzetten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

generalized models

A
  1. algemeen
    - uitbreiding naar niet-normaal verdeelde afhankelijke variabele
    - binomiaal = logistische regressie
    - Poisson = telling
  2. f(Y) = B0 + B1X1 + B2X2 + … + e
    - aanpassing van formule aan linker zijde
    - f(Y) = logit link functions
    - uitkomst maat wordt in functie gegoten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

logistische regressie

A
  1. gebruik
    - binaire variabele = 0 of 1
    - probleem lineaire regressie = rechte die waardes onder 0 of boven 1 geeft
    - logit functie = S-vormig met afgevlakt aan 0 & 1
  2. ln(p/1-p) = B0 + B1X1 + B2X2 + … + e
    - gebruik van logit link function f(Y)
    - logit (p) = ln (p/1-p)
    - p = kans dat Y = 1
    - 1-p = kans dat Y = 0
    - ook log-odds genoemd
  3. waardes forceren
    - waardes op S-vormig deel = tussen 0 & 1
    - toch een waarde moeten toeschrijven
    - cut-off = 0,5
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

logit functie

A
  1. ln(p/1-p) = B0 + B1X1 + B2X2 + … + e
    - B nog steeds kunnen interpreteren
    - als OR odds ratio ≠ directe kans
    –> niet zeggen kans is x keer hoger maar de ODDS zijn x keer hoger
  2. OR berekening
    - manier 1 = odds(niet) / odds(wel)
    - manier 2 = e^B
    - kan nooit negatief zijn
    - referentie = 1 = geen associatie
17
Q

evaluatie van het logistische model

A
  1. schattingen = AIC op basis van likelihood
  2. predicitieve capaciteit
    - sensitiviteit
    - specificiteit
    - accuraatheid
    - ROC-analyze
18
Q

sensitiviteit & specificiteit

A
  1. sensitiviteit
    - enkel in positieve groep kijken = wie wordt opgespoord
    - TPR true positive rate
    - TP/(TP+ FN)
  2. specificiteit
    - enkel in negatieve groep kijken = wie wordt opgespoord
    - TNR true negatieve rate
    - TN/(TN+FP)
  3. accuraatheid
    - (TP+TN) / totaal
    - kan vertekend beeld geven bij grote aantallen
    –> gedreven naar categorie die het meest voorkomt
19
Q

ROC-analyze

A

ROC = recieving operating curve

  1. grafiek
    - Y-as = sensitiviteit
    - X-as = 1-specificiteit
  2. per cut off plotten op grafiek = beste bepalen
    - lage cut-off = veel vals positieven = slechte specificiteit
    - hoge cut-off = veel vals negatieven = slechte sensitiviteit
  3. analyze
    - beide hoeken verbinden = verbind lijn
    - AUC = area under the curve
    - AUC van verbind lijn = 0,5
  4. goede ROC-curve
    - boven de verbind lijn
    - grotere AUC als de verbind lijn
    - best = zichter bij linker bovenhoek = grotere AUC
20
Q

uitbreiding logistische regressie

A
  1. interacties = ln(p/1-p) = B0 + B1X1 + B2X2 + B3X2X3 + e
  2. random intercept = ln(p/1-p) = B0 + B1X1 + B2X2 + B0 + e
  3. combinatie = ln(p/1-p) = B0 + B1X1 + B2X2 + B3X2X3 + B0 + e
21
Q

grafische voorstellingen bij longitudinale data

A
  1. beschrijvende statistiek
    - alles per meting
    - split cases of select cases
  2. spaghetti-plot
    - graphs -> chart builder
    - line -> multiple lines
    - x-as = tijd
    - y-as = score
    - color = id of groep bij veel id’s
    - statistic = value
    - mogelijkheid van betrouwbaarheids interval ook aan te zetten
  3. andere line-plot kan ook
22
Q

model opbouwen in SPS

A
  1. analyze
  2. mixed models
  3. lineair
  4. aanduiden
    - subjects = ID
    - data moet in lang formaat zijn
  5. continue
    - dependent value = score
    - factor = categorische variabele
    - covariate = continue variabele
  6. extra
    - fixed = vaste effecten = tijd, groep & combinatie
    –> LAAT OP FACTORIAL STAAN
    - random = include intercept per ID
    - statistics = eerste 1,3 & 4e
    - estimated marginal means = kan voor main effects & interactie
    –> enkel interactie kunnen
    - save = predicted values & residuals
23
Q

interpretatie van uitkomst

A
  1. information criteria = verschillende modellen vergelijken
  2. estimates of fixed effects = regressie model opstellen
  3. covariance parameters
    - covariantie van data binnen subjecten
    - covariantie van data binnen residuelen
    - ICC berekenen = subjecten/(subjecten+residuelen)
  4. EMMEANS = gemiddelde tussen groepen
24
Q

controleren van voorwaarden

A
  1. lineariteit = scatterplot tussen afhankelijk & onafhankelijk continu
  2. collineariteit = regression
  3. homoskesasticiteit = scatterplot residuen tov. predicted
  4. normale verdeling
  5. ICC = zie covariance