Vocês não pensaram em criar um RAG ao invés de usar o FineTunning?

Pessoalmente eu prefiro muito mais usar um RAG com verificação de similaridades e captura do contexto por base nessa similaridade, dessa forma o custo é menor e consegue gerar reposta com extrema precisão.

Observação: no dia 25 de janeiro foi lançado novas versões de Embedding que estão mais poderosos e muito mais baratos.

O que seria um RAG e como ele funciona?

https://www.tabnews.com.br/LuC45m4Th3u5/o-que-e-rag-a-tecnica-inovadora-que-esta-transformando-os-modelos-de-linguagem
Tenho uma trilha que fala de todos os conceitos relacionados as GenAI, entre eles FineTuning, RAG, VectorStore... RAG vai estar na parte 11 que sai semana que vem! https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-9 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-8 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-7 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-6 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-5 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-4 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-3 https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-2-pt-br https://andredemattosferraz.substack.com/p/desvendando-a-genai-parte-1-pt-br