Project R-11950

Titel

Modellering van hoogdimensionale multivariate overlevingsgegevens met clustering gebruikmakend van frailty en copula modellen. (Onderzoek)

Abstract

In dit project bestuderen we statistische frailty en copula modellen voor hiërarchisch geclusterde multivariate overlevingsvariabelen. Dit zijn positieve stochastische grootheden die gebruikt worden om een tijd tot een gebeurtenis uit te drukken. Doordat deze variabelen gegroepeerd zijn in sub-clusters en clusters ontwikkelen we nieuwe frailty en copula modellen om de invloed van verschillende covariaten te bestuderen op de overlevingsvariabelen. Hierbij focussen we ons ook op de associaties die er zijn tussen de overlevingsvariabelen door deze hiërarchische groepsstructuur. De motivatie voor deze nieuwe modellen komt vanuit de gegevens van de 2014 Kenya Demographic Health Survey. In deze gezondheidsenquête verzamelden men bij ongeveer 14.000 gezinnen informatie over de gezinssamenstelling waaronder de overlevingstijd van kinderen onder de 5 jaar in een huishouden. Door de grote hoeveelheid variabelen in deze dataset gebruiken we eerst random survival forest –methoden om de belangrijkste variabelen te identificeren die een invloed hebben op de overlevingstijd van kinderen onder 5 jaar. Hierna gebruiken we nieuwe frailty en copula modellen om het effect van deze variabelen op de overlevingstijd te onderzoeken. Doordat er zoveel huishoudens zijn in deze dataset gebruiken we hierbij sample splitting methoden om deze effecten te kunnen schatten.

Periode

01 oktober 2021 - 31 december 2023