Titel
Modellering van hoogdimensionale multivariate overlevingsgegevens met clustering gebruikmakend van frailty en copula modellen. (Onderzoek)
Abstract
In dit project bestuderen we statistische frailty en copula modellen voor hiërarchisch geclusterde multivariate
overlevingsvariabelen. Dit zijn positieve stochastische grootheden die gebruikt worden om een tijd tot een
gebeurtenis uit te drukken. Doordat deze variabelen gegroepeerd zijn in sub-clusters en clusters ontwikkelen we
nieuwe frailty en copula modellen om de invloed van verschillende covariaten te bestuderen op de
overlevingsvariabelen. Hierbij focussen we ons ook op de associaties die er zijn tussen de overlevingsvariabelen
door deze hiërarchische groepsstructuur. De motivatie voor deze nieuwe modellen komt vanuit de gegevens van
de 2014 Kenya Demographic Health Survey. In deze gezondheidsenquête verzamelden men bij ongeveer 14.000
gezinnen informatie over de gezinssamenstelling waaronder de overlevingstijd van kinderen onder de 5 jaar in
een huishouden. Door de grote hoeveelheid variabelen in deze dataset gebruiken we eerst random survival forest
–methoden om de belangrijkste variabelen te identificeren die een invloed hebben op de overlevingstijd van
kinderen onder 5 jaar. Hierna gebruiken we nieuwe frailty en copula modellen om het effect van deze variabelen
op de overlevingstijd te onderzoeken. Doordat er zoveel huishoudens zijn in deze dataset gebruiken we hierbij
sample splitting methoden om deze effecten te kunnen schatten.
Periode
01 oktober 2021 - 31 december 2023