Om tegemoet te komen aan de stijgende vraag naar een structureel beheer van de groeiende hoeveelheid data in levenswetenschappelijk onderzoek, lanceert het Vlaams Instituut voor Biotechnologie (VIB) de Data Core faciliteit.
Nieuwe technologieën zorgden de laatste jaren voor een exponentiële groei van data in de life sciences. De missie van de nieuwe Data Core is baanbrekend onderzoek mogelijk te maken door onderzoeksdata efficiënt te beheren en met behulp van internationale standaarden te hanteren.
Dankzij technologische vooruitgang wordt de life-sciencessector met een gigantische en groeiende toevloed aan data geconfronteerd. Daarbij gaat het om zogenaamde high-throughput technologieën zoals next-generation sequenering en nieuwe beeldvormingsmethodes. Die technieken bieden baanbrekende inzichten in moleculaire mechanismen en biologische processen en zijn gebaseerd op immense hoeveelheden data. Ter vergelijking: om een volledig menselijk genoom te beschrijven zouden 130 boekvolumes nodig zijn waarbij elke pagina dubbelzijdig bedrukt is met een 4-punts lettergrootte, ofwel 3 miljard letters. Het VIB schat dat het naar schatting 10 petabyte aan data beheert (omgerekend zo’n 10 miljoen gigabyte). Het spreekt voor zich dat een dergelijke data-explosie met de nodige uitdagingen gepaard gaat.
De Data Core van het VIB zal verschillende aspecten van onderzoeksdata beheren: de opslag, analyse en het delen van data en onderzoekers kunnen ook een beroep doen op de Data Core voor de infrastructuur en diensten die nodig zijn om grote datasets te managen. Om de kwaliteit, reproduceerbaarheid en standaardisatie van de beschikbare data te verzekeren, zal Data Core een platform bouwen om metadata aan data toe te kennen op een gebruiksvriendelijke manier. Dat moet onderzoekers helpen om aan de voorwaarden van onderzoeksfinanciering te voldoen. Bovendien wordt het zo makkelijker om data voor analyse en samenwerkingen te delen tussen verschillende onderzoeksgroepen.
“Door onze toegewijde data-infrastructuurdiensten uit te bouwen en te versterken, willen we de graad van standaardisatie, reproduceerbaarheid van data en natuurlijk de kwaliteit van onze data verhogen. Hoewel dat misschien abstract klinkt, zal dat uiteindelijk tot meer toegankelijkheid leiden voor onze onderzoekers zodat ze de goudmijn aan data die we ter beschikking hebben kunnen inzetten voor meer en beter onderzoek”, zo zegt Frederik Coppens, Hoofd van de VIB Data Core.
Data Core zal ook gevoelige data over ziektes, zoals genomische data of patiëntengegevens beheren. Daarnaast zal ze nauw samenwerken met Sciensano en andere partners binnen de EU om dataveiligheid en -privacy te verzekeren. Het doel is om een eenduidig aanspreekpunt te zijn voor databeheer, van vergaring tot en met verwerking, analyse en datadeling om de standaardisatie en kwaliteit van data te promoten.
Alle data zal onderhevig zijn aan de FAIR principes volgens dewelke data vindbaar, toegankelijk, interoperabel en herbruikbaar moet zijn. Die principes laten het delen en gebruiken van wetenschappelijke data op de meest impactvolle en nuttige manier toe.
Ten slotte zal de Data Core internationale standaarden integreren en nauw samenwerken met onderzoekscentra, andere core faciliteiten en experten buiten het VIB om flexibiliteit en harmonisatie te verzekeren.