Overlevingsdata Flashcards
(26 cards)
1
Q
algemeen overlevingsdata
A
- risico
- relatief risico = risico 1 / risico 2
- risico verschil = risico 1 - risico 2 - probleem
- iedereen zal ooit outcome hebben vb: sterven
- geen rekening houden met tijd tot optreden
- nood aan overlevingsanalyze
2
Q
overlevingsanalyze
A
- eindpunt = tijdstip van bepaald kenmerk bekomen
- overlijden
- zangerworden
- sportletsel
- herstel/herval/terugkeer werk
- verbetering van 2 putnen op een schaal - outcome
- dichotoom: eindpunt bereikt ja/nee
- ook rekening houden met lengte tot eindpunt of censoring
- time at risk = tijdsduur tussen start & eindpunt of einde van studie - incidentiedichtheid
- aantal sterftes/tijd at risk
–> doden/persoonsjaar
- kan ook voor verschillende letsels tov. trainingsuren
- vooral van belang voor vergelijkingen voor populaties of sporten
3
Q
tijden
A
- overlevingstijd
- kalender tijd
- leeftijd
- tijd sinds laatst voorkomen vb: revisie prothese - origin time kiezen
- start van bloodstelling
- verschillende starttijden kunnen vereenvoudigd worden naar zelfde beginmoment
- experimenteel = tijdstip van randomisatie - einde
- sterfte/bereiken van dichtome
- of censoring = drop-out/einde van studie
4
Q
censoring
A
- left-censoring = bij begin
- opvolging pas na eigenlijke startdatum
- deel van populatie zal al dichotoom zijn - right-censoring = bij einde
- terugtrekking = withdrawal
- stoppen van studie
- lost to follow-up
- true survivaltime > observed survival time - voorwaarden = at random
- moet non-informative zijn = geen informatie bevatten
- individuen moeten representatief zijn voor alle proefpersonen die tot op T overleven
- prognose van overlevindtijd tot T wordt niet beinvloed door censoring op T
- censoring heeft geen invloed op resterende overlevingstijden
5
Q
survivor functie
A
- S(t) = P(T>t)
- kans om langer dan een tijdstip te overleven
- T = niet-negatieve toevalsveranderlijke die aangeeft na hoeveeltijd de gebeurtenis zich voordoet
- S(t) = kans tussen 0-1 of %
- t = 0 dan S(t) = 1
- t = oneindig dan S(t) ≈ 0
–> vaak al voor dit moment stoppen - verloop van functie
- theoretisch = sigmoidaal
- in praktijk met stappen - ^S(t) = geschatte
- empirische schatting door gegevensindeling van faaltijden
- geen censoring = overlevend voorbij punt t / totaal aantal deelnemers
- wel censoring = Kaplan-Meier
6
Q
Kaplan-Meier
A
- algemeen
- overlevingsdata visueel in kaart brengen
- follow-up tijd opgedeeld in kleine peroide
- per kleinen periode = kans op overleven berekenen
–> persoon aan begin van periode nog overlevend - S(t) = S(t-1) x overlevingsfractie
- alle probaliteiten van vorige fracties vermenigvuldigen met elkaar
- overlevingsfractie = levend op einde / levend in begin
–> censoring niet mee tellen - mediane overlevingstijd
- kleinste tijd waarbij overlevingsfunctie =< 0,5
- indien niet kunnen berekenen = minder dan de helft heeft dichtoom gehaald tijdens de studie
- mediane overlevingstijd >= mediane observatietijd
–> overleving = tijd tot gebeurtenis
–> observatie = tijd tot gebeurtenis of censuur
7
Q
logrank-test
A
- inhoud
- vergelijken van overlevingscurves
- tussen 2 groepen = niet-parametrische test
- H0: h1(t) = h2(t)
–> geen verschil tussen Kaplan-Meier curves
- optimaal wanneer risico constant is over tijd - gelijkenissen met chi-kwadraat
- verwacht tov. geobserveerd indien H0 juist is
- op elk tijdstip ≠ chi-kwadraat
- testgrootheid X² = som G->g (O-E)²/E
- verdeling volgend aantal vrijheidsgraden = groepen - 1
–> log-rank waarde kunnen omzetten naar p-waarde met tabel - SPSS
- in Kaplan-Meier test
- Compare Factor -> Log Rank aanduiden
8
Q
Breslow & Tarone-Ware test
A
= log-rank voor meerdere groepen
–> onderling andere weging
- log-rank = zelfde gewicht bij elk falen = 1
- Breslow/Wilcoxon
- houd meer rekening met begin van survival curve
- nog meer PP at risk = falen in begin weegt meer door - Tarone-Ware
- gebruiken wanneer effect groter is in begin van toepassing - keuze
- altijd op voorhand
- resultaten leiden meestal tot zelfde conclusie
- toch keuze maken = meeste power
- klinische reden voor bepaalde curve
9
Q
Kaplan-Meier SPSS
A
- analyze
- survival
- Kaplan-Meier
- time & dichotome status kiezen
–> define evens
- factor = groep
- save = survival plots
- CI = 95% aanduiden
- compare factor = Log-rank - outcome
- survival plot
- tabel met alle waardes
–> geen estimate, … = censoring
10
Q
hazardrate
A
- risicofunctie of hazardfunctie
- verhouding van de kans
- dat de gebeurtenis gebeurd in een tijdsinterval / breedte van interval
- onder de voorwaarde dat de gebeurtenis nog niet is opgetreden
- ≈ indicentiedichtheid maar dan voor bepaald interval - formules
- hazard = parametrische schatting van survival functie
- hazard is constant: h(t) = λ landa
- vertalen naar survivalfunctie = S(t) = exp(-λt) - gemiddelde hazard rate
- h = totaal # falen / som geobserveerde overlevingstijden
- berekenen per groep
- hogere hazard = kleinere kans van overleven
- in spss berekenen door data -> aggregate voor sommen & berkenening bij transform -> comute variable
11
Q
hazardratio
A
- inhoud
- hazard 1 / hazard 2
- zelfde als incidentiedichtheid ratio
–> verschil is dat dit niet op geobserveerd maar op gemodelleerde data is
- geen effect therapie: HR = 1
- verschil RR & OR = HR is cumulatief over gehele periode
–> tijd wordt ook belangerijk - interpretatie
- kleiner als 1 = hazard reductie
- groter als 1 = stijging
- 1 = gelijk blijven over tijd
- hoger: x-1 = % van stijging
- lager: 1-x = % van daling
12
Q
coxregressie
A
- doel
- Kaplan-Meier & logrank toont verschillen aan
- coxregressie zal deze verschillen kwantificeren - cox proportional hazard model
- regressie op hazard = uitkomen van formule om hazard in te schatten
- h(t,X) = h0(t) x exp(B1X1 + B2X2 + …)
–> ln van beide geeft som ≈ lineaire regressie
- h0t = baseline hazard
–> wordt niet geschat
- regressiecoëfficienten B = worden wel geschat
–> met MLE - e^B = hazard-ratio
- 95% betrouwbaarheids interval berekenen door b + 1,96xSE
- indien 1 niet in CI = sign. verschillend
- combinatie verschil in aantal & verschil in tijd
- hazardratio moet constant zijn over tijd - andere uitkomsten
- standaard fout
- wald-statistic = (B/SE)^2
–> chi-sqr met 1 vrijheidsgraad
13
Q
uitbreiding coxregressie
A
- likelihood-ratiotest = omnibus test of model coëfficent
- test om 2 modellen te vergelijken
- chikwadraatverdeling met 1 vrijheidsgraad
- bijhorende p-waarde
- beslissen voor samenstelling model - meerdere groepen = dummyvariabelen maar gebeurt automatisch
- continue determinant
- Kaplan Meier & log-rank niet mogelijk
- altijd coxregressie gebruiken
- regressiecoëfficiënt = verschil in uitkomst bij verschil in 1 tijd
- negatief = lager hazard <=> positief
- ligt vaak dicht bij 1 maar per tijd dus exponentieel - voorbeeld voor 3j verschil
- HR = exp(3xB)
- HR = expB^3
14
Q
coxregressie spss
A
- analyze
- survival
- coxregression
- time kiezen
- status kiezen = define event
- categorisch = aanduiden dat categorisch is & referetie categorie kiezen
- options = confidence interval - assumpties
- log minus - keuze van referentie
- meestal placebo tov. referentie = actieve behandeling
- keuze andersom dan is B2 = 1/B1
15
Q
cox-regressie met meerdere variabelen
A
- main-effects model
- zonder interacties
- toevoegen van covariaat = andere variabele is nauwkeuriger geworden = kleiner CI
- zelfde interpretatie als appart - 2-wegsinteractie
- main effect x interactie effect^waarde van variabele
- met alle variabelen die in model zitten rekening houden tenzij = 0
16
Q
assumpties voor cox-regressie
A
- censoring = non-informative
- proportionele hazards = continu over tijd
- lineair verband tussen continue covariaten & hazard
- geen multi collineariteit tussen covariaten
- onafhankelijkeheid van survival tijden
17
Q
controle van proportionaliteit
A
- algemeen
- verhouding van hazards = hazard ratio
- blijft gelijk over tijd
- invloed van covariaat is onafhankelijk over tijd - grafische controle
- log minus log aanvinken tijdens coxregressie & categorische variabele kiezen
- transformatie van survival curve
- niet mogelijk voor continue variabelen = categorische maken
–> best 3-4 groepen
- visuele controle = paralelle lijnen = moet niet perfect zijn!
- Schoenfeld residuals plotten - statistische test = Goodness of fit test
18
Q
controle van lineariteit
A
- algemeen
- effect van continue covariaten op ln(hazard) is lineair
- controle door transformatie van variabele vb: kwadrateren, log, … - controle door kwartielen = continu -> categorisch
- 3/4 groepen = visual binding in SPSS
- zien of effect lineair is
- significantie onderling zien = coxregessie opnieuw uitvoeren - martingale residuals
- nulmodel tov. continue variabele
- M = O - H(t)
- M = martingale residu
- O = geobserveerde status (0 of 1)
- H(t) = verwachte aantal op basis van gefitte model - martignale in SPSS
- save hazards in numodel = enkel tijd & status
- manueel in SPSS berekenen door nieuwe variabele = hazard - observeerd
- lineair verband controleren door scatterplot met Y = martignale & X = variabele te testen
–> toevoegen van LOESS fit-line
19
Q
controle van multicollineariteit
A
- indicaties
- hoge bivariate correlatie
- hoge standaardfouten voor regressiecoëfficient
- groter veranderingen van regressiecoëfficient bij toevoegen predictoren
- regressiecoëfficient met tekens tegengesteld aan verwachting - implicaties
- geen probleem indien enkel om effect te zien = geen interpretatie - oplossing
- verwijderen gecorreleerde variabele
- variabele selectie op basis van Lasso
- PCR principal component regression = maken van nieuwe variabele die vorige combineert
20
Q
AIC
A
- Akaike’s informatiecentrum
- vergelijken van modellen
- informele vergelijking = geen p-waarde
- niet-geneste modellen = alle variabelen van beide modellen moeten verschillend zijn - AIC
- 2k - 2ln(L) = 2 x #parameters - 2 x loglikelihood
- houd rekening met complexiteit = aantal parameters
- kleiner is beter
- absolute waarde heeft geen betekenis: enkel onderling vergelijken
21
Q
LRT
A
- likelihood ratio test
- vergelijken van modellen
- geneste modellen = complexe modellen tov. gereduceerde modellen
- op basis van likelihood - formele vergelijking = p-waarde
- H0: complexere model past niet beter
- H1: complexere model past beter - test statistic
- LRT = 2 x log(complex) - 2 x log(gereduceerd)
- volgt chi-sq met df = aantal parameters
–> houd rekening met complexiteit
- LRT > Xsq(1-alfa) = H0 verwerpen
- LRT < Xsq(1-alfa) = H0 behouden
22
Q
overfitting
A
- algemeen
- model te complex voor data
- optimistische resultaten
- geen reproductie naar realiteit/toekomst
–> geen wetenschappelijke waarde - wanneer
- teveel predictor variabelen
- multiplicatieve effecten vb: interactie
- geautomatiseerde selectie = forward & backward selectie
- pretesten van kandidaat-predictoren - duimregel voor model selectie
- 10-15 gebeurtenissen = 1 df verliezen
- continue variabele = 1 df
- categorische variabele met K categorieën = K-1 df
- interactie = 1 df
23
Q
non-collapsibility van HR
A
- paradox van simpson
- HR = event1/time1 x event2/time2
- gemiddelde van subgroepen is verschillend van HR voor totaal
- vb: vrouwen = 2, mannen = 2 dan is totaal ≠ 2
- altijd appart berekenen
24
Q
gestratificeerde randomisatie
A
- gestratificeerde randomisatie
- randomiseren in subgroepen indien geweten dat variabele prognostische waarde zal hebben
- vb: even veel mannen & vrouwen in elke groep maar onderling gerandomiseerd - effecten
- groepen zijn meer vergelijkbaar
- beschermen tegen type I-fout = vals-positief
–> er worden minder testen uitgevoerd
- verhoogde power & statistische efficiëntie
25
andere speciale gevallen
1. assumpties niet voldaan
- hazard niet proportionaal = gestratifieerde cox of cox met time-dependent variabelen
- recurrent events = kunnen meerdere keren voorkomen
- event zorgt ervoor dat ander event niet kan voorkomen = cox met competing risks
- clustering is aanwezig = frailty model
26
rapportage
1. aantal gebeurtenissen
1. frequentie & redenen voor censurering = lost to follow-up & administratief
1. mediaal & maximale follow-up tijd
2. totaal aantal geobserveerde persoonsjaren
2. Kaplan-Meier-Curven
2. mediane overlevingstijd of geschatte overleving op tijdstip
2. type p-waarde = log-rank test vs Waldtest
2. hazard & hazard ratio's