Preciso de uma ajudinha 😅
. Fala devs! Tudo bem?
Contexto (historinha, pode pular se quiser)
É o seguinte, estou fazendo um projeto para a feira de ciências que vai acontecer na minha escola daqui a umas 2 semanas. O tema geral da feira é inteligência artificial, e cada sala vai abordar um subtema. No caso da minha sala, vamos falar sobre robótica! Isso mesmo, vamos abordar robôs com inteligência artificial!
Como já tive contato uma vez com a API da OpenAI, formei um grupo e sugerimos a seguinte ideia:
Podemos criar um robô simples que conversa com as pessoas usando IA. Ele teria um corpo simples de papelão e um celular/tablet preso à cabeça, onde exibiríamos um rostinho amigável na tela. As pessoas poderiam conversar livremente com ele.
A ideia foi bem aceita pelo pessoal, e o meu grupo (com 4 pessoas) começou a desenvolver o projeto. Duas pessoas ficariam responsáveis por montar o corpo do robô, enquanto outras duas cuidariam do site. Eu fiquei encarregado do site junto com meu amigo (que também é um bom DEV).
Nós organizamos a estrutura do site da seguinte maneira:
- Front-end (meu amigo): Criar um rostinho amigável que piscará, moverá a boca, etc.
- Back-end (eu): Quando o usuário clicar na tela ou no botão, gravar a voz e armazená-la em um arquivo, converter o áudio em texto, enviar para a API do GPT, converter o texto em áudio e reproduzi-lo.
Tudo correu conforme o planejado, e meu amigo praticamente já concluiu a parte dele. Agora, estou procurando apenas uma API, a de converter texto em áudio. Encontrei uma muito boa para converter áudio em texto, mas não consegui encontrar a outra. Claro, com um teste grátis que dure pelo menos 9.000 letras (ou 1 hora). A feira terá uma duração de cerca de 4,5 horas, então planejo obter várias chaves e alterná-las durante os intervalos.
Resumindo
Preciso de uma API que converta texto em áudio, que tenha um teste grátis de pelo menos 9.000 letras (ou 1 hora), ou que tenha um preço bem acessível.
Agradecimentos
Muito obrigado por ler até aqui! Fiquem à vontade para dar sugestões e opiniões. Estarei lendo todos os comentários. Novamente, muito obrigado, e tenham um ótimo feriado!
Opa, tem um monte de api freemium de speech to text no rapidapi:
https://rapidapi.com/search/audio%20to%20text
Algumas são bem baratas inclusive. E se quiseres, pode fazer como pensaste, de se inscrever em várias e ir alternando entre elas, isso só vai complicar um pouquinho a tua lógica, mas deve funcionar...
Só presta atenção para se inscrever no plano certo, e não estourar os limites para não ser cobrado a mais...
Meu amigo, eu nunca usei e não sei como funciona e nem se é bom de verdade, mas API pra converter texto em voz vi os serviços abaixo, que parecem muito bons e com preços muito atraentes.
Amazon: https://aws.amazon.com/pt/polly/ Microsoft: https://azure.microsoft.com/en-in/products/ai-services/text-to-speech/#pricing IBM: https://www.ibm.com/products/text-to-speech
Abraços.