(DUVIDA) Poderiam me ajudar com um projeto ?
Bom dia, pessoal!
Estou começando a me aprofundar na área de inteligência artificial e gostaria de tirar algumas dúvidas com quem já trabalha ou tem experiência, principalmente em projetos voltados para treinamento e análise de imagens.
Atualmente, estou desenvolvendo um aplicativo com React Native utilizando o Expo, e pretendo implementar uma IA que seja capaz de analisar imagens e, com base em um prompt que eu enviar, fornecer sugestões ou interpretações sobre o conteúdo dessas imagens.
Pesquisando sobre soluções, encontrei o Google Vertex AI, que parece ser bem robusto, mas observei que há custos por requisição, o que pode ser um problema para mim neste momento.
Outra alternativa que considerei foi usar a LLaMA, mas nesse caso o modelo teria que rodar localmente no meu backend, o que exigiria mais infraestrutura da minha parte.
Queria saber se alguém já trabalhou com algo semelhante e se poderia me indicar a melhor abordagem, considerando custo, desempenho e facilidade de integração com o app.
O problema maior ai é a IA analisar imagens, quando ela analisa uma imagem ela pega o base64 da imagem (na maioria das vesez) e gera a descrição, então você precisa salvar o embedding em um banco vetorial para que ela possa fazer a comparação com outras imagens depois. Não tem pra onde fugir, esses modelos consomem muitos tokens e processamento, mas há algumas soluções baratas, pode usar o replicate.com ele só cobra por uso, então pra rodar em produção pode ser interessante, e tem o huggingface que hospeda alguns modelos de embedding e tu pode usar gratuitamente com algumas limitações e tambem ainda da pra contribuir com a comunidade. Eu ja usei bastante la quando eu tava testanto uma aplicação justamente igual essa que tu ta fazendo. Hoje em dia a empresa roda um modelo no servidor local que recebe as requisições por api rest.
Creio que não há como fugir do custo, a grande maioria das IAs que valem a pena usar vão te custar realmente, seja ou para consumir o modelo por API, ou precisará de uma infraestrutura dedicada com GPU para o bom desempenho do modelo. Ainda mais se tratando de análise de imagens que costumam consumir mais tokens.
Por outro lado creio que com poucos créditos como 5 ou 10 dólares você consegue testar o seu app na maioria dos provedores. O que você vai ter que resolver então seria a precificação do seu app para que você não fique no prejuízo no caso de um pico de usuários. A própria OpenAI com sua infraestrutura gigante teve que limitar a geração de imagens porquê tava pesando nos datacenters deles.
Por fim, ceritfique-se de que os usuários grátis tenham um plano limitado e que o rate-limit da API está funcionando para não ocasionar em custos inexperados. Faça uma boa precificação dos planos com acesso premium como pacotes de créditos de geração de imagem.