Intelligenza artificiale, basta un minuto per clonare una voce

L’intelligenza artificiale segna un nuovo traguardo e diventa rapidissima nell’analizzare e ‘clonare’ le voci umane: il programma Deep Voice di Baidu, il concorrente cinese di Google, è riuscito a farlo riducendo i tempi da mezz’ora a meno di un minuto. Il progetto dei ricercatori cinesi, descritto sul sito Arxiv, è quello di dare alle macchine una ‘voce’ più simile a quella umana quando parlano con l’uomo.

Per farlo hanno insegnato alla macchina a trasformare un testo in parole con il timbro vocale di una persona, grazie ad un sistema, basato su reti neurali, capace di riprodurre la voce di migliaia di persone con meno di mezz’ora di ‘studio’. Prima si registrano i campioni di voce per permettere al sistema di imparare a riconoscere la voce della persona e poi gli si fa leggere un testo definito a voce alta con la voce del soggetto imitato. Partendo solo da poche frasi della durata di 5 secondi, hanno ottenuto un buon risultato in termini di somiglianza e naturalezza della voce.

Il sistema funziona così bene che è in grado anche di imitare e manipolare la voce, aggiungendole accenti diversi a seconda della provenienza geografica o cambiandola come se fosse del sesso opposto. Per i ricercatori questo sistema potrebbe essere usato dalle persone che hanno perso l’uso della voce. Ma non mancano i rischi di applicazioni poco lecite. Per esempio gli interrogatori registrati dalla polizia potrebbero diventare inutili una volta che chiunque può generare la stessa conversazione con un semplice smartphone, oppure un ladro di identità potrebbe impossessarsi per sempre di dati e voce di qualcuno. Senza contare l’uso di registrazioni false o conversazioni politiche per influenzare il risultato di elezioni. (fonte)

You may also like...