Ferramenta criada por Shashank Jain é capaz de imitar a voz de qualquer pessoa após ouvir áudio de apenas 20 segundos
Uma nova ferramenta de inteligência artificial, batizada de Tortoise TTS (Text-to-Speech), é capaz de replicar a voz de qualquer pessoa após analisar um arquivo de áudio de apenas 20 segundos.
Ao Daily Mail, Shashank Jain, criador da ferramenta, disse que sua ideia inicial era criar um programa que permitisse gerar podcast baseado em texto. “Com a chegada do ChatGPT, podemos gerar conversas no formato que quisermos, fornecer o feed para a ferramenta que criei e resultar num podcast entre dois oradores à nossa escolha”, explicou.
Para testar a ferramenta, o portal britânico pediu para Jain fazer o ex-presidente norte-americano Donald Trump ler um trecho do clássico ‘Os Três Porquinhos’. O resultado pode ser conferido abaixo!
Apesar da experiência, Shashank já se diz preparado para manter o Tortoise protegido de quem queira usar a ferramenta de forma indevida; mesma preocupação tida pela Microsoft, que em janeiro anunciou o VALL-E, uma tecnologia similar — esta capaz de clonar a voz de alguém só a ouvindo por três segundos.
O anunciou gerou polêmica entre o público que teme que o VALL-E seja usado por golpistas para acessarem sistemas que usam voz como senha. Por fim, outro exemplo da ferramenta de Jain foi a do ator Tom Hanks recitando 'Ezequiel 25:17' de Pulp Fiction. Confira!