L'intelligenza artificiale di Microsoft imita qualsiasi voce sulla base di una registrazione di tre secondi

Microsoft ha introdotto l'intelligenza artificialeVALL-E.Genera registrazioni vocali basate su

Lo studio ha dimostrato che un modello addestrato su molte brevi clip ha generatoParlato inglese che non può essere distinto dall'originale.

Ricercatori della Cornell Universityha utilizzato il modello VALL-E per analizzare i meccanismi di generazione del parlato. Nel loro lavoro, il cui preprint è pubblicato sul server arXiv, gli scienziati esaminano una rete neurale addestrata sulla base di 60.000 ore di parlato in inglese. Questo è centinaia di volte superiore rispetto agli analoghi esistenti.

Come funziona l'IA. Immagine: VALL-E

L'analisi ha mostrato che il sistema ha abbastanzauna clip di tre secondi per imitare la voce dell'interlocutore. Allo stesso tempo, Vall-E è di gran lunga superiore al sistema TTS odierno in termini di voce dal suono naturale e somiglianza vocale. Inoltre, può preservare le emozioni di chi parla e l'ambiente acustico (l'influenza delle proprietà acustiche della stanza in cui è stata effettuata la registrazione originale).

Il sistema di generazione sviluppato è ancora chiuso peraccesso pubblico, ma i ricercatori hanno pubblicato esempi di campioni e file vocali finiti sul sito su Internet. I campioni di parlato generato variano in termini di qualità. Mentre alcuni suonano naturali, altri sembrano generati dalla macchina. Gli autori dello sviluppo notano che l'ulteriore formazione in voci diverse, anche con accenti diversi, migliorerà la qualità del sistema.

Campione di voce umana. Audio: VALL-E

Registrazione generata che preserva il rumore esterno. Audio: VALL-E

I ricercatori notano anche che la possibilitàla generazione di voci identiche a quelle originali crea nuove sfide per la sicurezza in quanto può essere sfruttata dai truffatori. Ritengono che prima che il modello venga ampiamente rilasciato al pubblico, sia necessario sviluppare un sistema che riconosca i record generati dall'intelligenza artificiale.

Leggi di più:

Il segreto della durabilità del cemento romano è svelato: può essere ripristinato

I genetisti hanno determinato in che modo l'età del concepimento negli esseri umani è cambiata in 250.000 anni

Il sole ha aperto l'anno con un lampo della classe più potente