Il giorno in cui Siri ci dirà se siamo malati

Sfruttando sistemi di intelligenza artificiale, ricercatori e startup stanno sviluppando applicazioni sempre più raffinate per la diagnostica vocale, con qualche implicazione per la privacy

(Kevin Frayer/Getty Images)
(Kevin Frayer/Getty Images)

Vocalis Health è una startup israelo-statunitense, sviluppa sistemi di riconoscimento vocale e si è posta un obiettivo piuttosto ambizioso: riconoscere le persone malate di COVID-19 dal modo in cui parlano. Il sistema potrebbe semplificare le diagnosi della malattia (che nelle sue fasi iniziali ha sintomi che possono essere confusi con l’influenza o altri problemi respiratori) ed è solo uno degli sviluppi più recenti delle soluzioni per riconoscere automaticamente problemi di salute tramite il tono della propria voce. Il settore è in piena espansione e potrebbe portare un giorno ad avere assistenti vocali, come Siri o Alexa, in grado di rilevare la presenza di particolari malattie nei loro interlocutori.

Voce e COVID-19
Come racconta Nature in un lungo articolo dedicato al tema, qualche tempo fa gli sviluppatori di Vocalis avevano realizzato un’applicazione per smartphone in grado di rilevare affezioni croniche polmonari – come le ostruzioni bronchiali – attraverso l’analisi della voce degli utenti. Partendo da quell’esperienza, hanno realizzato un’app sperimentale chiedendo a individui risultati positivi al coronavirus di partecipare, registrando la loro voce una volta al giorno seguendo le indicazioni sullo schermo (descrivere una fotografia, oppure contare da 50 a 70).

Vocalis ha poi utilizzato i propri sistemi di intelligenza artificiale, mettendo a confronto le registrazioni con quelle di chi era invece risultato negativo al test per il coronavirus. Attraverso processi di apprendimento automatico (“machine learning”), il sistema ha provato a identificare una sorta di impronta vocale della COVID-19. Grazie a circa 1.500 campioni sonori raccolti dai volontari, è stato poi possibile sviluppare uno strumento ora sperimentato in diversi ospedali in giro per il mondo in parallelo con i tradizionali sistemi per le diagnosi.

Secondo i promotori dell’iniziativa, lo strumento potrebbe rivelarsi utile per rilevare i casi più probabilmente positivi tra gli individui che mostrano sintomi, anche lievi, al punto da non rendersi conto di essere malati. Ciò consentirebbe di concentrare le attività di test sui probabilmente infetti indicati dall’applicazione, riducendo tempi e costi per le analisi di laboratorio.

Gli sviluppatori di Vocalis sono al lavoro per migliorare l’applicazione e per renderla più accurata, saranno quindi necessari ancora diversi mesi prima di sapere se sia sufficientemente affidabile. La startup non è comunque l’unica ad avere avviato sperimentazioni di questo tipo. Alcuni centri di ricerca hanno sviluppato app per provare a riconoscere la COVID-19 dal modo in cui si tossisce, con risultati preliminari valutati con interesse dalla comunità scientifica.

Diagnostica vocale
Ancora prima dell’inizio della pandemia, i sistemi di diagnostica vocale avevano iniziato a raccogliere importanti investimenti, complice il miglioramento delle intelligenze artificiali e la possibilità di sperimentarle su un grande numero di dispositivi, dagli smartphone agli assistenti per la casa. Le soluzioni proposte non riguardano solamente malattie respiratorie, ma anche autismo, problemi cardiovascolari, demenza e depressione. Alcune sono ai primi stadi, altre hanno raggiunto forme più avanzate e iniziano a essere commercializzate, seppure nell’ambito di programmi sperimentali con pochi pazienti.

Il nostro modo di respirare e di parlare coinvolge numerose strutture anatomiche, dai polmoni al setto nasale passando per la trachea, e le minime variazioni nel funzionamento di alcune di queste parti possono essere identificate da sistemi di analisi piuttosto raffinati, come quelli resi possibili dal machine learning. La grande disponibilità di dati e registrazioni audio di voci umane, in qualsiasi contesto, e la potenza raggiunta dai computer rendono possibile l’analisi di quantità gigantesche di dati dai quali si possono trarre specifiche informazioni tramite gli algoritmi.

Parkinson
Alcune malattie modificano sensibilmente il nostro modo di parlare, e per questo le prime ricerche avviate anni fa si erano orientate verso il loro studio e la loro analisi al computer. La malattia di Parkinson è una di queste: comporta problemi motori e spasmi muscolari che si riflettono anche nella respirazione e nel modo di articolare le parole. Gli individui malati di Parkinson tendono ad avere una voce più debole e a volte tremolante, facilmente distinguibile a orecchio. Ma un algoritmo che attraverso 10mila campioni di voci si è allenato a riconoscere queste caratteristiche riesce a essere molto più preciso, e potrebbe rivelarsi utile per aiutare nella diagnosi della malattia in una sua fase precoce, quando è ancora molto difficile da identificare.

Nature fa l’esempio di una ricerca pubblicata nel 2012 e condotta presso l’Università di Birmingham, nel Regno Unito. I suoi autori si chiesero se fosse possibile aiutare i medici a compiere diagnosi attraverso l’analisi della voce dei loro pazienti. Utilizzarono le registrazioni di 43 pazienti, 33 dei quali soffrivano di Parkinson, ai quali era stato richiesto di pronunciare a lungo la vocale “A”. Utilizzarono poi algoritmi di analisi del parlato, identificando 10 indicatori tipicamente ricorrenti nelle voci dei pazienti. Utilizzandoli, il sistema fu in grado di distinguere la voce di un individuo sano da uno malato con una precisione del 99 per cento.

I ricercatori in seguito hanno rilevato alcune caratteristiche della voce che aiutano a comprendere il livello di gravità dei sintomi del Parkinson. Il loro sistema è ancora sperimentale, ma potrebbe essere impiegato in numerosi ambiti, per esempio per monitorare più facilmente gli individui a rischio di sviluppare la malattia, oppure per offrire servizi di diagnosi preliminare, in attesa di avviare un percorso tradizionale di visita da un neurologo.

Alzheimer
Le malattie neurodegenerative sono un campo dove le tecnologie di analisi vocale potrebbero offrire importanti opportunità. In Canada, per esempio, un gruppo di ricercatori ha utilizzato i campioni di voce di 250 individui per identificare tratti tipici nella parlata di chi potrebbe avere l’Alzheimer. La ricerca ha rilevato come le persone che hanno poi ricevuto una diagnosi della malattia tendessero a utilizzare parole più corte, un maggior numero di pronomi rispetto ai sostantivi e ripetizioni nelle stesse frasi.

Isolati 35 marcatori vocali, il sistema è stato in grado di riconoscere individui con l’Alzheimer con una precisione dell’82 per cento. In successive analisi, il sistema è stato poi perfezionato, raggiungendo un’accuratezza del 92 per cento. Anche in questo caso, una soluzione di questo tipo potrebbe essere impiegata per compiere diagnosi precoci per una malattia difficile da identificare nei suoi primi stadi.

Altre malattie
Altri sistemi sono stati sperimentati in individui più giovani con problemi di sviluppo neurologico. Una ricerca svolta tre anni fa in Germania su un numero ristretto di neonati ha portato allo sviluppo di un algoritmo per predire casi di autismo. Nella fase sperimentale, il sistema classificò correttamente l’80 per cento dei casi di bambini con autismo. Con una soluzione analoga è stata sviluppata una soluzione di analisi per rilevare il disturbo da deficit di attenzione/iperattività (ADHD).

Un’altra ricerca negli Stati Uniti si è invece dedicata all’analisi della voce degli individui che soffrono di disturbo da stress post-traumatico, una condizione psicologica che si sviluppa a causa di un evento traumatico o violento di grande rilevanza per il soggetto (riguarda per esempio molti soldati al loro ritorno dal fronte). Dall’analisi delle registrazioni di 129 reduci di guerra sono stati estratti 18 indicatori, quasi tutti legati a un modo di parlare lento e monotono, che hanno poi permesso di identificare quali ex soldati avessero problemi psicologici con una precisione del 90 per cento.

Problemi e riproducibilità
Gli studi condotti finora hanno riguardato un numero ristretto di individui, e per questo molti osservatori sono scettici sull’efficacia dei sistemi, considerato che gli esiti degli esperimenti sono difficili da riprodurre. Per superare queste limitazioni, alcune aziende hanno avviato programmi per raccogliere grandi quantità di registrazioni, o per facilitare la loro raccolta attraverso iniziative online.

La società statunitense Sonde Health, per esempio, gestisce SurveyLex, una piattaforma online che permette ai ricercatori di creare facilmente campagne per la raccolta di registrazioni vocali da parte di volontari. L’idea è di poter catalogare decine di migliaia di voci, in modo da affinare gli algoritmi e le capacità di riconoscimento.

La stessa azienda ha collaborato lo scorso anno a una ricerca per valutare quanto influisca la qualità delle registrazioni sulla capacità dei sistemi di rilevare automaticamente le malattie. Con tracce vocali registrate tramite microfoni ad alta fedeltà in laboratorio, i sistemi hanno riconosciuto i volontari affetti da depressione con una precisione del 94 per cento, mentre il livello di accuratezza è sceso al 75 per cento in un esperimento condotto utilizzando registrazioni effettuate con gli smartphone, in ambienti diversi dai laboratori e quindi con maggiore rumore di fondo.

L’impiego di una maggiore quantità di campioni per istruire le intelligenze artificiali dovrebbe contribuire a rendere meno rilevante il problema, ma pone comunque ulteriori domande sull’utilità di queste soluzioni.

Utilità e privacy
Escluse alcune startup più agguerrite di altre nel modo in cui comunicano i loro risultati, per ora nessuno sviluppatore o ricercatore serio propone di sostituire le conoscenze e le capacità diagnostiche di un medico con un sistema per l’analisi della propria voce. L’idea è di utilizzare questi sistemi come una risorsa aggiuntiva per fare le diagnosi, inserendoli quindi tra gli strumenti di cui dispongono i medici per fare il loro lavoro.

Seppure non sia ancora molto evoluta, questa tecnologia pone comunque non pochi problemi etici e legati alla tutela della privacy, soprattutto in un settore delicato come quello della salute. Nulla impedirebbe un domani di utilizzare un sistema di diagnostica vocale per scoprire dalla registrazione della voce di qualcuno se sia malato o meno. Informazioni di questo tipo, raccolte senza esplicito consenso, potrebbero essere utilizzate da un’azienda per decidere se assumere qualcuno, oppure da una compagnia di assicurazioni per concedere o meno una polizza sulla vita.

Una tecnologia non è di per sé cattiva, dipende dall’uso che se ne fa e da come si decide di normarne gli impieghi. Nel caso della diagnostica vocale c’è ancora tempo prima di avere soluzioni pratiche affidabili a sufficienza, ma secondo gli esperti questo non dovrebbe distogliere dalla necessità di iniziare a parlarne e soprattutto di valutare come metterla in pratica per trarne benefici riducendo al minimo i rischi.