Il sistema giudiziario sottovaluta gli errori della trascrizione automatica

Molte procure e tribunali utilizzano software che – come dimostra l'inchiesta di Genova – sono poco affidabili in un contesto delicato come un'indagine o un processo

Un'aula di tribunale di Milano durante un'udienza
Un'aula di tribunale di Milano durante un'udienza (LaPresse/Mourad Balti Touati)
Caricamento player

Le indagini della procura di Genova sulle presunte tangenti ottenute dal presidente della Liguria Giovanni Toti e dal presidente dell’autorità portuale di Genova Paolo Emilio Signorini hanno rinvigorito le discussioni in corso da tempo tra avvocati, magistrati e giudici in merito all’utilizzo della tecnologia, e in particolare dei software per la trascrizione automatica di cui negli ultimi anni si sono dotate molte procure e tribunali italiani. Il dibattito è ripartito da un errore molto grave che avrebbe potuto influenzare l’intera inchiesta, se non scoperto in tempo.

Il 26 maggio nell’ufficio della giudice per le indagini preliminari di Genova Paola Faggioni è stato riascoltato l’audio dell’interrogatorio di Roberto Spinelli, indagato per corruzione con il padre Aldo. L’ascolto era stato chiesto dagli avvocati di Spinelli per chiarire un particolare decisivo per l’inchiesta.

Nella trascrizione dell’interrogatorio, infatti, era stato riportato che Spinelli aveva parlato di «finanziamenti illeciti» concessi a Toti. Un solo aggettivo – illeciti – avrebbe confermato in modo inequivocabile le accuse della procura, e non a caso proprio quel passaggio era stato messo in evidenza nei titoli di molti giornali nei giorni successivi. Tuttavia Spinelli aveva detto esattamente il contrario: «Finanziamenti leciti».

Come è emerso dagli accertamenti, l’origine di questa svista non era dovuta a un errore umano. La trascrizione dell’interrogatorio riportata nel verbale allegato all’inchiesta era stata fatta da un software speech-to-text, cioè programmato per convertire il parlato in testo scritto. Questi strumenti, ora economicamente più accessibili rispetto al passato, vengono utilizzati in moltissimi settori e anche dal sistema giudiziario, in particolare dalle procure e dai tribunali che negli ultimi dieci anni hanno dovuto fare i conti con una riduzione dei funzionari e dei trascrittori.

La tecnologia è senza dubbio un aiuto, soprattutto per inchieste impegnative come quella di Genova, ma diverse innovazioni sono state introdotte senza valutare troppo conseguenze e rischi. In più occasioni le camere penali, le associazioni degli avvocati penalisti che discutono con la magistratura dei problemi della giustizia, hanno tentato di sensibilizzare il sistema giudiziario sui possibili errori. Oltre alla trascrizione automatica, la questione riguarda anche i software utilizzati per analizzare grandi quantità di documenti, quelli per prevenire reati sulla base di dati storici o quelli che analizzano audio e fotografie.

La vicenda di Genova è emblematica perché dimostra quanto siano rilevanti i rischi. L’errore non è stato commesso nella trascrizione di un’intercettazione telefonica o ambientale, ma durante un interrogatorio in cui erano presenti la giudice, i magistrati e gli avvocati che poi hanno chiesto di riascoltare le parole del loro assistito: si è dovuto risolvere il dubbio con un secondo ascolto. È emerso tra le altre cose che il cancelliere addetto a riassumere il contenuto dell’interrogatorio non aveva nemmeno fatto cenno a un passaggio così importante.

I principali problemi legati all’utilizzo di questi software sono diversi. Il più rilevante, in parte presente anche quando il trascrittore è una persona, riguarda la previsione delle parole.

I sistemi di riconoscimento vocale e di trascrizione, infatti, vengono “allenati” con decine e in alcuni casi centinaia di migliaia di ore di audio tratte da programmi televisivi, udienze di tribunali e dibattiti politici. Questi audio sono accompagnati dalle relative trascrizioni ufficiali che consentono al sistema di imparare come trascrivere un audio.

Iacopo Benevieri è un avvocato cassazionista di Roma, cioè specializzato nell’assistenza di clienti all’ultimo grado di giudizio, la Corte di Cassazione. È anche presidente della commissione sulla linguistica giudiziaria della Camera penale di Roma, la prima commissione di questo tipo in Italia.

«Il sistema crea un modello probabilistico sulla base di migliaia di registrazioni in cui persone diverse e in luoghi diversi pronunciano una determinata parola», spiega Benevieri. «La conseguenza è che questi sistemi possono essere influenzati negativamente da un pregiudizio culturale determinato dall’insieme di dati di trasmissioni televisive, podcast e notiziari utilizzati per addestrare il sistema. […] Per rimanere sul caso di Genova: se nei dati vocali inseriti la parola “finanziamenti” è associata, nella maggioranza dei casi, a condotte illecite, il sistema riconoscerà come più probabile l’aggettivo “illeciti” rispetto a “leciti”».

Le procure e i tribunali non possono nemmeno prevedere questo tipo di errore perché non conoscono l’architettura di questi software: non sanno con quali informazioni sono stati addestrati, quali regole utilizzano per passare da un audio alla sua trascrizione, né tanto meno quali accorgimenti usano in caso di audio disturbato, per esempio quello ottenuto da intercettazioni ambientali o telefoniche. «Non esiste una regolamentazione e non esiste una consapevolezza critica di questi strumenti», continua Benevieri. «La trascrizione viene semplicemente delegata, senza nessun tipo di controllo».

Questi limiti riguardano anche la trascrizione fatta da persone. Le camere penali ne hanno discusso spesso negli ultimi anni, talvolta in seguito a clamorosi errori giudiziari causati da un’interpretazione errata delle intercettazioni. Spesso chi trascrive le intercettazioni non ha sufficiente consapevolezza della complessità del parlato, della forma e della soggettività dell’esposizione, dell’importanza delle pause e della lettura del contesto: si mira al contenuto piuttosto che alla forma e questo porta a dare informazioni errate a chi indaga. Un altro limite delle trascrizioni è la mancanza da parte di chi le compie del cosiddetto contesto enciclopedico, cioè delle conoscenze condivise esclusivamente tra le due persone intercettate e quasi sempre non accessibili a chi ascolta la conversazione e in seguito la trascrive.

Quello dei trascrittori è un lavoro complesso, molto sottovalutato e pagato pochissimo, che tuttavia può essere determinante in un’inchiesta. Eppure in Italia non c’è un albo professionale dei trascrittori, non esiste un protocollo ufficiale per le buone prassi o un percorso formativo obbligatorio e unico per i trascrittori. Le procure e i tribunali non sono obbligati a dotarsi di software per la trascrizione, ma i tagli al personale degli uffici giudiziari decisi dai governi negli ultimi anni hanno spinto molti a farlo. Non ci sono regole o indicazioni sulle caratteristiche o sui modi di utilizzo: il software viene comprato esattamente come se si comprasse una stampante.

Benevieri auspica un intervento normativo per introdurre una revisione della trascrizione automatica da parte di un trascrittore umano, una richiesta che si aggiunge alle tante già presentate da diverse camere penali, come l’istituzione di un albo nazionale dei trascrittori. Non si tratta di essere ostili alla tecnologia di per sé, dice. «Non possiamo rinunciare a questi software e all’intelligenza artificiale, ma dobbiamo capire come esercitare un controllo, una supervisione, e non delegare passivamente. Senza una revisione corriamo il rischio di concedere una pericolosa delega e di non avere più nessuna forma di garanzia su un potere enorme come la rappresentazione di una prova».