Voce e dati “in banca”. L’Intelligenza artificiale al servizio dei tribunali, con addestramento di una rete neurale a riconoscere se la voce dell’indagato è la stessa voce fra quelle intercettate durante le indagini. Il modello scientifico che compara le caratteristiche delle due voci e lo stesso metodo biometrico utilizzato per comparare le tracce di Dna presenti sulla scena di un crimine hanno dato vita a Intrepido, un sistema di nuova generazione sviluppato presso il Centro di ricerca interdisciplinare sul linguaggio (Cril) dell’Università del Salento (Dipartimento di studi umanistici), diretto dal professor Mirko Grimaldi. La ricerca è stata pubblicata sulla rivista internazionale Speech Communication. “Nel sistema attuale la figura del perito fonico non è prevista dal legislatore e la riforma Cartabia non ha colmato la lacuna”, commenta il professor Grimaldi, “l’identificazione del parlante in ambito forense è spesso lasciata al fai da te, assegnata cioè a figure che non hanno nessuna formazione specifica. Per questo, ogni perito si sente libero di usare il metodo che preferisce (raramente basato su presupposti scientifici), e la sorte dell’indagato può finire nelle mani del caso. Ciò non dovrebbe mai avvenire nelle aule dei tribunali, dove invece sono richieste evidenze oggettive, al di là di ogni ragionevole dubbio.

Risultati

I risultati ottenuti dal sistema che abbiamo sviluppato sono migliori di tutti gli altri attualmente in uso. Pertanto, Intrepido si propone come il sistema più affidabile di identificazione del parlante in campo forense e, grazie a questo strumento, magistrati, avvocati e periti hanno ora uno strumento in più per applicare i principi del giusto processo”. L’idea dei ricercatori salentini è stata quella di utilizzare una rete neurale, già scientificamente testata per altri scopi e a disposizione della comunità scientifica internazionale: SpeechBrain. La rete è stata “addestrata” a identificare le voci, estratte da YouTube, di oltre 7000 parlanti diversi (uomini e donne di età differente), i quali hanno prodotto oltre 1 milione di frasi, per circa 2.000 ore di registrazioni audio-video. Le lingue utilizzate sono state prevalentemente l’inglese (britannico e americano), il tedesco, il francese e l’indiano. I segnali audio utilizzati per addestrare la rete neurale sono stati degradati introducendo disturbi (rumore) caratteristico del mondo reale, come voci di sottofondo, risa, parlato sovrapposto, e altre tipologie di rumore. In questo modo le performance del sistema sono state migliorate. Gli studiosi del Cril hanno aggiunto una banca dati di voci rappresentative dell’italiano, ma anche di alcune varietà dell’arabo. Francesco Sigona e Mirko Grimaldi hanno testato il loro sistema seguendo un modello di validazione internazionale sviluppato da Geoffrey Morrison (Aston University, Birmingham) e da Ewald Enzinger (Stanford Research Institute, Silicon Valley). Sulla base di questo modello, la rivista Speech Communication ha pubblicato nel 2016 un numero speciale dedicato alla validazione di tutti i software attualmente disponibili a livello internazionale.

Aiuto

Una banca dati per non dimenticare nessuno. L’associazione Penelope affianca le famiglie e gli amici delle persone scomparse con il suo supporto. E’ costituita da volontari che offrono il loro aiuto gratuitamente. Raccoglie attorno a sé famiglie provate dal dolore per la scomparsa di un proprio caro. Le banche dati sono archivi di informazioni organizzate in modo tale da poter essere recuperate utilizzando specifiche tecniche di ricerca.”La banca dati del Dna è uno strumento che renderebbe possibile una più efficace risoluzione di taluni reati. Oltreché uno strumento davvero indispensabile per affrontare i casi delle cosiddette ‘persone scomparse’ – avverte Nicodemo Gentile-. La banca dati del Dna non si presenta come strumento a sé stante”. Infatti è concepita in modo da essere in sintonia con le banche dati degli altri paesi europei. La banca dati può anche ricevere dai laboratori della polizia scientifica e dei Ris dei carabinieri profili del Dna ottenuti dai reperti biologici acquisiti sulla scena del crimine e delle persone scomparse, consanguinei, cadaveri o resti cadaverici non identificati”. La Banca dati nazionale del dNA avrà al suo interno tre distinti e indipendenti database. Uno per il Dna proveniente da scene del crimine, uno per le persone scomparse e i resti cadaverici e uno per i soggetti previsti dalla legge. Da qui si capisce l’importanza di una banca dati del Dna aggiornata per consentire l’identificazione degli oltre 2000 corpi senza nome che giacciono negli obitori di tutta Italia. Foto di Julius Drost su Unsplash