Machine learning e Covid: c’è ancora del lavoro da fare

Machine learning e CovidSono numerosi i fronti della lotta contro il Covid.
Uno di questi vede l’impiego del machine learning per la formulazione di diagnosi e prognosi più rapide ed accurate rispetto ai metodi tradizionali.
L’idea consiste nell’utilizzare radiografie del torace e immagini TAC per addestrare il computer a riconoscere la malattia e prevederne l’evoluzione.

Nel corso del 2020 è stato pubblicato un numero considerevole di articoli scientifici sui nuovi modelli di apprendimento automatico, ma nessuno di essi è poi stato portato nella pratica clinica.
Infatti, secondo una recente revisione sistematica su 2.212 studi, nessuno dei modelli identificati appare attualmente di potenziale uso clinico a causa di difetti metodologici e/o bias sottostanti.

Le criticità riguardano prevalentemente i dataset di addestramento, risultati incompleti o troppo focalizzati su una determinata categoria non rappresentativa del totale, ad esempio i bambini.

Oppure, grandi database assemblati partendo da numerose banche dati più piccole ma eterogenee, i cui contenuti sono poi stati uniformati forzosamente generando distorsioni.
Ancora, diversi studi hanno impiegato dati provenienti da selezioni dei soli pazienti gravi, risultando così non rappresentativi della popolazione generale.

Il machine learning è dunque da buttare? Probabilmente no, ma bisogna concedere il tempo necessario perché gli algoritmi vengano sviluppati in modo affidabile partendo da dati completi e coerenti.
 
Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans