AI niet beter dan echte dokters bij vaststellen diagnoses

Je hoort de laatste tijd steeds vaker dat AI-algoritmes net zo goed – of misschien zelfs beter – zouden zijn in het stellen van diagnoses als menselijke dokters. Deze beweringen zijn onjuist, blijkt uit een studie in The Britisch Medical Journal. 

Het onderzoek werd uitgevoerd door een groep onderzoekers geleid door Imperial College London. Zij bestudeerden 91 peer-reviewed papers waarin deep-learning algoritmes werden toegepast. In deze papers bekeken de onderzoekers de medische gegevens van mensen op zoek naar veelvoorkomende aanwijzingen en symptomen van verschillende ziektes, variërend van kanker tot een glaucoom. Tien studies waren gebaseerd op fysieke tests en de andere 81 waren volledig academisch. 

De meerderheid van de 81 academische papers (69 om precies te zijn), beweerde dat artificiële intelligentie op zijn minst vergelijkbaar is met clinici in het vaststellen van een specifiek probleem. Slechts twee papers gaven toe dat dokters beter zijn dan machines. In 14 papers werd verklaard dat machine-learning modellen dokters kunnen helpen bij het vaststellen van diagnoses.

Veel papers beweren dus dat artificiële intelligentie beter is dan mensen in het vaststellen van diagnoses. Alleen is de geloofwaardigheid van deze studies ver te zoeken. De papers mogen dan wel indrukwekkende cijfers hebben, maar de tests zijn vaak gebaseerd op een te kleine steekproef of datasets die de auteurs zelf hebben samengesteld. In sommige gevallen is er zelfs fake data gebruikt. De betrouwbaarheid van de onderzoeken is daardoor niet bepaald hoog. 

Toekomst van AI in gezondheidszorg

Als interessante en nieuwe techniek trekt deep learning veel investeerders en ontwikkelaars aan. Het is echter nog te vroeg om te beweren dat deep learning beter is in medische onderzoeken dan dokters. Klinische tests duren vaak jaren om uit te voeren voordat medicijnen of medische apparaten als effectief worden beschouwd. Machine-learning code kan dit nog niet verkorten.  

Volgens de studie bestaan er momenteel overdreven claims over de gelijkwaardigheid met of superioriteit over clinici. Deze claims zijn een risico voor de veiligheid van patiënten en zelfs de gezondheid op maatschappelijk niveau, als algoritmes worden toegepast op miljoenen patiënten, klinkt het.

Hoewel de onderzoekers veel van de onderzoeken afkeuren, zijn ze niet alleen maar negatief over medische artificiële intelligente technologie. “Als machine learning op een goede manier wordt ontwikkeld en uitgebreid wordt geëvalueerd kan het veel delen van de gezondheidszorg hervormen.” Ook wanneer zorgsystemen zwaar onder druk komen te staan, kunnen AI-oplossingen waardevol zijn, mits ze gebruikt worden op een veilige en effectieve manier.