Project R-13211

Titel

Schaalbare Markov kettingen van probabilistische gegevensbanken voor de simulatie van besmettelijke ziektes (Onderzoek)

Abstract

In het afgelopen decennium werden probabilistische databases (PDBs) ontwikkeld als een manier om relationele gegevensbankondervragingen te integreren met probabilistisch redeneren. In dit project observeer ik dat Markov kettingen van PDBs een declaratieve manier vormen om de transmissie van besmettelijke ziektes te simuleren. Het efficient verwerken van deze kettingen maakt het dus mogelijk om deze transmissiemodellen op een flexibele, declaratieve manier te specifieren en vervolgens efficient te simuleren. Helaas is PDB query processing in zijn algemene vorm een gekend computationeel hard probleem. Daarenboven is query processing op Markov kettingen van PDBs nog moeilijker. Gemotiveerd door deze observaties is het mijn doel in dit project om praktische, schaalbare methodes voor query processing op Markov kettingen van PDBs te ontwikkelen. Hierbij zal de simulatie van besmettelijke ziektes dienen als een concrete use case. Mijn onderzoekshypothese is dat de beoogde methodes kunnen worden verkregen door op een principiele manier structurele karakteristieken van zowel queries als data tegelijkertijd te benutten. In het eerste deel van mijn studie wordt een Monte Carlo benadering bestudeerd met als hoofddoel de wisselwerking tussen het genereren van nieuwe stochastische variabelen, database statistieken en random sampling te benutten. In het tweede deel worden exacte en benaderende relationele querymethoden bestudeerd die de treewidth van zowel query als data benutten.

Periode

01 november 2022 - 31 oktober 2026