Project R-8196

Titel

Een declaratieve aanpak voor het optimaliseren van parallelle dataverwerking (Onderzoek)

Abstract

Binnen de database research is er een vernieuwde interesse voor parallelle dataverwerking. Hoewelparallelle en gedistribueerde systemen al langer bestaan, brengen cloud computing en de opkomst van big data nieuwe uitdagingen met zich mee. Terwijl parallellisme zich vroeger beperkte tot enkele servers worden nu honderden tot tienduizenden computing nodes gebruikt. Queries zijn niet langer beperkt tot simpele keyword zoekopdrachten, maar omvatten complexe join queries over meerdere database tables om data analyse op grote schaal mogelijk te maken. Daarnaast wordt snelheid niet langer gedomineerd door het aantal I/O requests naar extern geheugen zoals in traditionele systemen, maar door de communicatie nodig om data uit te wisselen over het netwerk tijdens een query evaluatie. Dit vereist nieuwe technieken om complexe queries te analyseren en optimaliseren voor parallelle settings.De opkomst van verschillende systemen bracht echter een opsplitsing van gespecialiseerde techniekenmet zich mee die moeilijk naar andere systemen overgebracht kunnen worden. In dit project wil ik een uniforme aanpak ontwikkelen om queries te optimaliseren voor parallelle systemen. Meer bepaald omvat mijn projectvoorstel de volgende doelstellingen: (1) een declaratief framework voor parallelle dataverwerking ontwikkelen; (2) beslisbaarheidsproblemen onderzoeken ter ondersteuning van statische analyse van queries in dit framework; (3) algemene technieken voor multi-query optimalisaties onderzoeken

Periode

01 oktober 2017 - 30 september 2019