TTS: Uma Ameaça para os Locutores?

A tecnologia avança a uma velocidade gigantesca, especialmente no mundo do TTS (“Texto para Fala” - sigla em inglês).

Como locutores, nós certamente estamos cientes dele – e alguns de nós podem até temer que essa tecnologia nos atropele. Será que isso pode acontecer?

O avanço do TTS:

O TTS é um sistema que converte a palavra escrita na palavra falada. Parece simples, não? Mas na verdade, o TTS é super complexo.

Para que ele consiga fazer a sintetização da fala humana, primeiramente ele eve criar um enorme banco de dados com “unidades de fala”, ou seja, pedaços de fala gravada, que inclui fones (sons vocálicos e consonantais), pares de fones, alofones, palavras e frases inteiras.

Após isso, o programa então agrupa as unidades em combinações específicas para criar uma fala sintética daquilo que foi escrito.

Embora a primeira “máquina falante” tenha sido inicialmente introduzida em 1939, os avanços do TTS nos últimos anos têm sido absurdamente mais rápidos comparados aos 75 anos anteriores.

Alguns dos avanços incluem:

Incorporar um modelo de trato vocal e outras características de voz para soar mais humano;

Corrigir erros de pronúncia da fala sintética, ajustar pronúncias regionais, adicionar ênfase e outros truques através da Linguagem de Marcação de Síntese de Fala (SSML, na sigla em inglês);

Produzir ligações robóticas que façam pausas e perguntas, por exemplo: “Você pode me ouvir?”. Ou mesmo esperar por uma resposta, antes de continuar seu discurso.

Copiar movimentos labiais para dublagem;

Consertar pequenos erros nas gravações de locução com edições sintéticas;

Criar um modelo, ou “banco de voz”, da voz de uma pessoa real para usar depois como voz sintética

Desde que o TTS começou a convergir com o aprendizado de máquina, megadados (big data) e inteligência artificial, o sistema tornou-se mais inteligente, mais realístico e, como mencionado anteriormente, uma ameaça presumida por alguns do mercado de locução.

As possíveis ameaças do TTS para o mercado de locução

Não há dúvida que os avanços do TTS despertaram uma série de preocupações em todo o mercado de locução. Abaixo, descreverei as mais comuns.

Perda dos direitos de utilização

A cessão de direitos de utilização de voz continua nos dando um fluxo constante de capital toda vez que nossa voz é usada, mesmo depois de um trabalho já ter sido gravado.

Entretanto, será que esse procedimento será válido para a utilização da nossa fala sintetizada?

Embora possamos esperar uma alta quantia pela sessão de gravação inicial, como poderíamos receber direitos de utilização por uma gravação que tecnicamente não fizemos?

Não ter controle de onde nossa voz é usada

Como a tecnologia permite que uma voz previamente gravada possa ser usada para criar qualquer tipo de mensagem ou texto, nós locutores tememos não ter nenhum poder de decisão sobre os tipos de trabalho que nossa voz será utilizada. Isso poderia acontecer?

Proibição de futuros contratos

Se oferecemos a aquisição de nossos bancos de vozes, poderíamos limitar nossas carreiras sem perceber.

Por exemplo, digamos que nossa voz seja utilizada por uma montadora de carros. Seríamos então proibidos de fazer trabalhos para outras montadoras no futuro – mesmo sem saber que estaríamos associados a uma montadora no momento da compra.

Mas afinal, os locutores devem se preocupar ou não?

Embora as preocupações com o TTS possam parecer válidas para nós locutores, por diversas razões, penso que não precisamos perder o sono por elas.

A primeira é que o TTS ainda apresenta muitas limitações – como a incapacidade de gerar espontaneamente a infinita gama humana de emoções e técnicas vocais.

Mesmo depois de muito avanço, a fala sintética ainda não se mostrou párea para as múltiplas nuances e composições da voz humana real.

Além disso, os pagamentos constantes de cessão de direitos de utilização de voz ainda podem (e devem) sim existir.

Por exemplo, além do recebimento pela gravação do banco de voz, poderíamos organizar acordos de licenciamento que descreveriam quando e onde nossas vozes poderiam ser usadas. Dessa forma, teremos controle exato do uso da nossa voz.

Resumidamente, se transformarmos o nosso medo do TTS em energia para a construção de uma estrutura clara de contrato, continuaremos a progredir na nossa carreira como locutores, garantindo que todos nossos direitos estejam cobertos.

E você, o que acha?

Com a tagcarreira, mercado de locução, oportunidades, tendência

TTS: Ameaça ou Oportunidade para os Locutores?