Una nuova Intelligenza Artificiale dedicata ai problemi sanitari
Categoria : Medicina digitale
Data : 26 maggio 2024
Autore : admin
Intestazione :
La nuova nata nella famiglia dei grandi modelli multimodali (LMM): Med-Gemini !
Testo :
Un recente articolo descrive le potenzialità in ambito sanitario di Med-Gemini di Google. I modelli linguistici di grandi dimensioni (LLM) sono sistemi di IA in grado di comprendere e generare il linguaggio umano. Basati sul Machine Learning (apprendimento automatico) con architettura Deep Neural Network (reti neurali profonde) sono addestrati su enormi quantità di dati testuali e affinati attraverso interazioni con curatori umani. I modelli in grado di gestire non solo testo ma anche audio, immagini e video sono definiti multimodali di grandi dimensioni (LMM). La differenza tra i modelli solo linguistici e gli LMM è stata paragonata a quella tra un corridore e un pentatleta. Un corridore è specializzato in una sola disciplina, mentre un pentatleta deve eccellere in più settori. Med-Gemini di Google appartiene ad una nuova famiglia di modelli multimodali specializzati in ambito medico, in grado di analizzare, sintetizzare, comprendere, gestire e combinare diverse tipologie di informazioni, tra cui testo, immagini, audio, video, ricerche web, codice. Le potenzialità dei modelli Gemini in medicina sono state illustrate in un articolo pubblicato recentemente da un team di ricercatori di Google [1].
Med-Gemini si propone idealmente di imitare il ragionamento clinico umano e di integrarlo via web con informazioni aggiornate mediante autorevoli fonti bibliografiche. Nell’articolo il modello viene valutato su 14 parametri di riferimento (benchmark) clinici che spaziano da testo ad applicazioni multimodali. Cimentato sul popolare benchmark MedQA, un questionario con domande a scelta multipla rappresentativo dell’ USMLE (United States Medical Licensing Examination), serie di esami che testano la capacità e la maturità del medico per entrare nel sistema sanitario americano, Med-Gemini raggiunge prestazioni all’avanguardia, allo stato dell’arte (SoTA), su 10 parametri, superando GPT-4 con ampio margine in ogni confronto.
Su 7 benchmark multimodali, tra cui la sfida nel riconoscimento delle immagini dal data set del New England Journal of Medicine (NEJM), Med-Gemini ha ottenuto risultati migliori di GPT-4 V[2], con un margine relativo medio del 44,5%. Il modello è stato valutato anche in compiti quali il riassunto di note mediche per generare un report strutturato da fornire al paziente al termine della consultazione, la produzione di richieste di consulenza per un altro professionista, la sintesi in linguaggio semplice di materiale medico. L’articolo descrive inoltre le potenzialità di Med-Gemini per una futura utilità nel mondo reale descrivendo ipotetici ma realistici dialoghi multimodali. In un esempio un paziente chiede un parere a Med-Gemini su noduli pruriginosi comparsi sulle gambe e sulle braccia. Il modello chiede di condividere un'immagine dei noduli, formula alcune domande, fornisce rapidamente la diagnosi di prurigo nodularis motivandola e propone diverse opzioni di trattamento. In un altro esempio viene descritto il dialogo tra un MMG che chiede a Med-Gemini di refertare un Rx torace. Quando il modello descrive alterazioni degenerative della colonna, il medico chiede se possono spiegare la lombalgia del paziente. Med-Gemini spiega allora la differenza tra causalità e correlazione e suggerisce ulteriori indagini per spiegare la natura del dolore. Il medico chiede infine al sistema di IA di fornire una relazione utilizzando un linguaggio non tecnico per facilitare la comprensione e la comunicazione con il paziente.
Riflessioni conclusive Sicuramente, come scrivono i ricercatori di Google, “I grandi modelli linguistici multimodali stanno inaugurando una nuova era di possibilità per la salute e la medicina. Le capacità dimostrate da Gemini e Med-Gemini evidenziano un balzo in avanti delle opportunità per accelerare le scoperte biomediche e assistere la fornitura e le esperienze di assistenza sanitaria”. Gli stessi ricercatori riconoscono tuttavia che “è fondamentale che i progressi nelle capacità del modello siano accompagnati da una attenzione alla affidabilità ed alla sicurezza di questi sistemi”. Saranno tuttavia necessari studi metodologicamente robusti, validati nella pratica clinica per implementare questi sistemi nella pratica quotidiana, utilizzando criteri di valutazione basati su outcome maggiori come morbilità e mortalità. Il modello deve inoltre ancora incorporare i principi dell'IA responsabile, tra cui il diritto alla privacy e all'equità, in tutto il processo di sviluppo. Si spera che la recente legge europea (AI Act) [3], primo quadro giuridico completo in assoluto sull'IA in tutto il mondo, possa realmente promuovere un'IA affidabile, garantendo il rispetto dei diritti fondamentali, la sicurezza e i principi etici.
Giampaolo Collecchia e Riccardo De Gobbi
Riferimenti bibliografici
1)Saab K et al. Capabilities of Gemini Models in Medicine 2024 arxiv.org/abs/2404.18416 2)http://www.pillole.org/public/aspnuke/news.asp?id=8222 3)https://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai
Per approfondire la tematica del ragionamento clinico: Collecchia G, De Gobbi R, Fassina R, Ressa G, Rossi RL: La Diagnosi Ritrovata. Il Pensiero Scientifico Editore http://pensiero.it/catalogo/libri/professionisti/la-diagnosi-ritrovata
Per iniziare a conoscera la Intelligenza Artificiale in Medicina: Giampaolo Collecchia e Riccardo De Gobbi: Intelligenza Artificiale e Medicina Digitale Il Pensiero Scientifico Ed. Roma 2020 http://pensiero.it/catalogo/libri/pubblico/intelligenza-artificiale-e-medicina-digitale
|