Opa, show demais, parabéns!!

Só achei isso curioso:

"Muita gente perguntava como fizemos nossa voz de IA.""

Visto que: https://docs.aws.amazon.com/polly/latest/dg/doc-history.html "This is the first release of the Amazon Polly Developer Guide: November 30, 2016"

Além de outras soluções que o mercado oferece há um tempo.

Exatamente, existem vários TTS por aí.

A diferença é que a nossa IA faz:

  • Censura
  • Lê o texto com voz de personagens e de famosos e não de um modelo padrão da google/azure,etc
  • Sotaques diferentes

Todos os TTS sempre tem uma qualidade absurda em inglês mas em português nem tanto. Temos vários sotaques dentro do país, então mesmo se a gente usasse algum TTS desses já diponíveis como base e a voz clonada fosse de um carioca, era claro perceptível que aquela voz falando com sotaque do interior de SP não combinava.

A gente focou em ter um TTS próprio, treinar um modelo próprio, pra ter um TTS base que fosse muito bom no português. Tanto que disso, saiu outro produto, o voz pra video onde a gente visa ser uma Elevenlabs brasileira

Entendi, o desafio era o idioma falado em portugues, sotaques, vozes de famosos e etc... Show demais, parabéns por terem construido algo fora do que se via no mercado!