Het Neura-project, opgestart door dr. Sami Barrit, specialist in opleiding in neurochirurgie aan de ULB, betekent een belangrijke vooruitgang op het gebied van generatieve artificiële intelligentie, specifiek toegepast op de biomedische wetenschappen. Een pilootstudie in neurologie, waarin Neura werd geconfronteerd met complexe klinische scenario's, toonde zijn diagnostische prestaties tegenover een cohort neurologen, met indrukwekkende gestandaardiseerde scores van 86,17% in totaal.
Het doel van Neura is om generalistische taalmodellen te transformeren in gespecialiseerde hulpmiddelen voor professionals in de gezondheidszorg, onderzoekers, studenten en zelfs patiënten. Deze generatieve AI-oplossing, geprezen door de l'Académie Nationale de Chirurgie française et la Fondation l'Avenir, wil een "toegankelijke, transparante en betrouwbare" interface bieden die voldoet aan de hoge eisen van geneeskunde en onderzoek.
Een centraal aspect van Neura is de mogelijkheid om de huidige grote taalmodellen, zoals de GPT-derivaten van OpenAI, te specialiseren door middel van reverse engineering. Dr. Barrit legt uit: "Conventionele methoden om deze modellen te specialiseren vereisen aanzienlijke middelen, zowel computertechnisch als menselijk, die ontoegankelijk zijn voor de gemiddelde onderzoeker. Wij hebben gekozen voor een aanpak [...] die intuïtief is en toegankelijk voor geïnteresseerde onderzoekers, artsen en studenten." Deze specialisatie, geïnspireerd door de principes van Explainable Artificial Intelligence (XAI), probeert LLM's toegankelijk te maken met respect voor de principes van digitale soevereiniteit.
De architectuur van Neura is geïnspireerd door de neurowetenschappen en maakt gebruik van een 'langetermijngeheugen' om gespecialiseerde kennis van belang te coderen en een kortetermijngeheugen om interacties van gebruikers te volgen en een uitgebreide klinische context te integreren. Deze structuur maakt diepgaande personalisatie en contextualisatie mogelijk en zorgt ervoor dat de verstrekte informatie niet alleen relevant maar ook controleerbaar is.
De pilootstudie in de neurologie, waarbij Neura werd geconfronteerd met complexe klinische scenario's, toonde de diagnostische prestaties aan. "We namen een cohort van 13 neurologen, jonge en oudere specialisten. We vroegen hen een differentiaaldiagnose te stellen op basis van patiëntinformatie en klachten voor vijf complexe klinische scenario's. We vergeleken de resultaten op basis van een blinde, anonieme evaluatie".
Neura behaalde gestandaardiseerde scores van 86,17% overall, 85% voor differentiaaldiagnoses en 88,24% voor einddiagnoses (55,11%, 46,15% en 70,93% voor neurologen) met snelle responstijden van 28,8 en 19 seconden (9 minuten en 37,2 seconden en 8 minuten en 51 seconden voor neurologen), terwijl ze systematisch relevante informatie gaven en de gebruikte bronnen nauwkeurig vermeldden. "Deze resultaten tonen de waarde aan van LLM-gestuurde toepassingen voor het integreren van gegevens die zijn verkregen en geanalyseerd door de menselijke expert met een enorme hoeveelheid kennis, waardoor het menselijk ervaringsgericht redeneren wordt verbeterd voor klinische en onderzoeksdoeleinden.
Deze prestaties overtreffen niet alleen de menselijke diagnostische capaciteiten, maar omvatten ook snelheid en nauwkeurigheid van antwoorden, het consistent leveren van relevante informatie en het nauwkeurig vermelden van de gebruikte bronnen. Dr. Barrit merkt op: "Heel belangrijk is dat er geen sprake was van hallucinatie - d.w.z. het genereren van valse informatie of verkeerde bronnen."
Ondanks deze vooruitgang hebben de onderzoekers een genuanceerde kijk op de toekomst van dergelijke technologieën. Ze erkennen zowel het ontwrichtende potentieel van LLM's in de geneeskunde als hun beperkingen, vooral in situaties waar er een gebrek aan informatie is of waar origineel redeneren op hoog niveau vereist is. Het project is er niet alleen op gericht om de klinische besluitvorming te verbeteren, maar ook om de mens-machine interface te verrijken, waarbij menselijk redeneren wordt verbeterd in plaats van vervangen.
Kortom, Neura positioneert zichzelf als voorloper in de toepassing van generatieve AI op basis van XAI-principes in de geneeskunde en belooft niet alleen de diagnostische nauwkeurigheid te verbeteren, maar ook medische training en onderzoek te verrijken. De besprekingen voor een partnerschap met twee toonaangevende Franstalige universiteiten zijn in volle gang. Er wordt momenteel gewerkt aan een piloot-toepassing op het gebied van spoedeisende geneeskunde, algemene geneeskunde en infectieziekten, in samenwerking met Franstalige academische instellingen en verenigingen.