ChatGPT bij medische consultaties: een baanbrekende studie meet de mogelijkheden en beperkingen

Het EpiCURA-ziekenhuis, de Universiteit van Mons, het UMC Sint-Pieter en Hôpital Foch (Parijs) namen deel aan een van de eerste internationale studies over de prestaties van ChatGPT bij het beheer van concrete klinische gevallen. Hoewel blijkt dat AI diagnoses kan stellen en suggesties kan doen voor aanvullend onderzoek en passende behandelingen, is het (nog) niet klaar om de expertise van de arts te vervangen.

De evolutie van artificiële intelligentie is indrukwekkend. ChatGPT lijkt in staat om met succes universiteitsexamens af te leggen en legt verrassend veel theoretische kennis over geneeskunde aan de dag. Er zijn echter nog veel vragen over de grenzen van de huidige AI-systemen, meer bepaald of ze in staat zijn om de menselijke medische zorg te beheren.

Een internationale studie bij 45 patiënten

Professoren Jérôme Lechien en Stéphane Hans publiceerden onlangs de resultaten van een studie bij 45 patiënten met veel voorkomende aandoeningen in de huisartsenpraktijk en op NKO-afdelingen. Het klinische beeld van deze patiënten werd voorgelegd aan het AI-systeem ChatGPT. In de studie legde de arts de symptomen, voorgeschiedenis, geneesmiddelen en klinische onderzoeksresultaten van de patiënt voor aan het systeem. Vervolgens vroeg hij naar mogelijke differentiële diagnoses, de hoofddiagnose, aanvullende onderzoeken en behandelingen. Twee artsen analyseerden de prestaties van ChatGPT met behulp van hetArtificial Intelligence Performance Instrument (AIPI), een nieuw klinisch instrument dat tijdens de studie werd ontwikkeld en gevalideerd.

Een aannemelijke en juiste diagnose in 63,5 % van de gevallen

Algemeen stelde ChatGPT in 63,5 % van de gevallen een aannemelijke en juiste diagnose en in 28,5 % van de gevallen geloofwaardige (alternatieve) differentiële diagnoses. De aanvullende onderzoeken die het AI-systeem voorstelde om de diagnose te bevestigen waren relevant en geheel of gedeeltelijk noodzakelijk in 29 % van de gevallen. De behandelingen waren in 22 % van de gevallen relevant en noodzakelijk; in 16 % van de gevallen relevant maar onvolledig. In de overige gevallen waren de voorgestelde therapeutische interventies een combinatie van relevante, noodzakelijke, ongepaste en onnodige behandelingen. 

Wat is de rol van AI?

Algemeen biedt AI heel wat mogelijkheden en is het een krachtige virtuele encyclopedie, maar het kan (nog) geen diagnoses en aanvullende onderzoeken onderscheiden en rangschikken naar relevantie. Hoewel AI heel nuttig kan zijn bij het opleiden van jonge artsen, is het nog niet in staat om het menselijk onderscheidingsvermogen van de arts te vervangen. Bovendien wordt er vaak een lijst met aanvullende onderzoeken voorgesteld, waarvan er veel niet nuttig of niet relevant zijn. Dit kan tot verwarring leiden bij patiënten die AI zouden gebruiken voor ze hun arts raadplegen. "Er is verder onderzoek nodig naar het potentieel van AI in de geneeskunde en naar de rol die AI kan spelen om de kwaliteit van de patiëntenzorg te verbeteren", concluderen de onderzoekers.

Professor Jérôme Lechien werkte ook mee aan een studie die onlangs werd gepubliceerd in hetzelfde tijdschrift, European Archives of Oto-Rhino-Laryngology. De studie onderzoekt de mogelijkheden van ChatGPT als hulpmiddel voor klinische besluitvorming bij sialendoscopie en om patiënten voor te lichten.

U wil op dit artikel reageren ?

Toegang tot alle functionaliteiten is gereserveerd voor professionele zorgverleners.

Indien u een professionele zorgverlener bent, dient u zich aan te melden of u gratis te registreren om volledige toegang te krijgen tot deze inhoud.
Bent u journalist of wenst u ons te informeren, schrijf ons dan op redactie@rmnet.be.