Vocês não pensaram em criar um RAG ao invés de usar o FineTunning?
Pessoalmente eu prefiro muito mais usar um RAG com verificação de similaridades e captura do contexto por base nessa similaridade, dessa forma o custo é menor e consegue gerar reposta com extrema precisão.
Observação: no dia 25 de janeiro foi lançado novas versões de Embedding que estão mais poderosos e muito mais baratos.
O que seria um RAG e como ele funciona?
https://www.tabnews.com.br/LuC45m4Th3u5/o-que-e-rag-a-tecnica-inovadora-que-esta-transformando-os-modelos-de-linguagem
Tenho uma trilha que fala de todos os conceitos relacionados as GenAI, entre eles FineTuning, RAG, VectorStore... RAG vai estar na parte 11 que sai semana que vem!
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-9
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-8
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-7
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-6
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-5
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-4
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-3
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-2-pt-br
https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-1-pt-br