Titel
Een process discovery algoritme voor verkennende data analyse (Onderzoek)
Abstract
Samenvatting NL: Er wordt steeds meer data gegenereerd in de bedrijfswereld. Zowel de hoeveelheid data als de soort data die verzameld wordt, is veranderd tijdens het afgelopen decennium. Dit project focust op event data, die beschrijft hoe (bedrijfs-)processen worden uitgevoerd. De eerste stap om een inzicht in data te krijgen is een exploratieve data-analyse (EDA). Hoewel er veel algoritmes bestaan om procesmodellen uit event data te ontdekken, is er geen enkel dat geschikt is voor EDA. Modellen voor EDA hebben twee belangrijke vereisten. Ten eerste zouden ze enkel de geobserveerde data mogen beschrijven. Ten tweede zouden ze verstaanbaar moeten zijn zodat interessante patronen eenvoudig kunnen herkend worden. Het probleem met de huidige algoritmen is dat ze modellen creëren die gedrag omvatten, dat niet geobserveerd werd in de log. Daarnaast optimaliseert bijna geen enkel van de bestaand technieken zijn modellen voor verstaanbaarheid. Het project voegt waarde toe in zowel het process mining- als het data analyticsveld. Het is de eerste creatie van een discovery algoritme dat geschikt is voor EDA. De resulterende modellen representeren enkel geobserveerd gedrag en zijn geoptimaliseerd voor verstaanbaarheid. Verdere toevoegingen van dit project zijn een eerste verstaanbaarheidsmaatstaf die gedupliceerde taken in rekening brengt en alternatieve visualisaties voor partieel parallelisme en lange-termijn afhankelijkheden.
Periode
01 oktober 2017 - 31 augustus 2018