Project R-14396

Titel

Integromics - Naar integratie van grote bio-moleculaire data om systeembiologie mogelijk te maken (Onderzoek)

Abstract

Snelle vooruitgang in high-throughput technologieën heeft het mogelijk gemaakt om snel en efficiënt een grote hoeveelheid omicsdata te genereren. Deze data kunnen kennis opleveren over het onderliggende effect van moleculen in biologische systemen [1]. In de afgelopen decennia is uitgebreide analyse op één niveau van omics-data, zoals genexpressieanalyse en RNA-sequentieanalyse, de gebruikelijke standaardaanpak geweest. Het combineren van omicsdata in een uitgebreide multi-omics dataset creëert echter snel een paradigmaverschuiving in biomedisch onderzoek, omdat het een effectieve manier biedt om de kracht van multi-level omics-data te benutten, door nog krachtigere inzichten te bieden in de systeembiologische interpretatie. Integratieve analyse is echter niet eenvoudig, vooral door de hoge dimensionaliteit en heterogeniteit van de gegevens en door het gebrek aan een universeel analysekader [2]. Verschillende methoden, zoals matrixfactorisatiemethoden, netwerkgebaseerde methoden, correlatiegebaseerde integraties, zijn ontwikkeld om integratieve analyse te vergemakkelijken [3, 4], Maar deze methoden pakken problemen rondom multi-omics integratie niet volledig aan, zoals ongelijke variabiliteit vanwege de verschillende schaal van de metingen en het gebrek aan robuuste oplossingen voor de dataanalyse. Hoewel er de afgelopen jaren methoden voor geïntegreerde data-analyse zijn ontwikkeld, bestaat er nog geen uniform raamwerk (niet de methodologie, niet de software). Het doel van dit gezamenlijke onderzoeksproject tussen het SCK-CEN en DSI in de UHasselt is het ontwikkelen van statistische raamwerken en softwaretools voor het integreren en analyseren van multi-omics data, gebruikmakend van verschillende soorten -omics datasets gegenereerd op het SCK-CEN en andere open-source databanken. We richten ons op twee belangrijke onderzoeksdoelstellingen: (1) Ontwikkeling van methodologie voor integratieve analyse. Dit doel is het ontwikkelen van een methodologie voor integratieve analyse die zich richt op twee primaire analyseniveaus, namelijk een globale analyse en een lokale analyse. Voor beide onderzoekslijnen is ons doel om gemeenschappelijke patronen te vinden (van kenmerken en monsters) over meerdere omics-gegevens die beschikbaar zijn voor het experiment van interesse. (2) Softwareontwikkeling. De softwareontwikkeling voor de methodologieën beschreven in doelstelling (1) zal worden uitgevoerd in het R- en/of Pythonplatform. Deze doelstelling zal gelijktijdig met doelstelling (1) worden uitgevoerd.

Periode

01 augustus 2023 - 31 juli 2027