Tive essa dúvida, nao fiz muitos testes no local, porém imagino que faze o uso controlado com um RAG ou FineTuning para algumas atividades específicas devem valer, mas me pergunto,pq não usaria o chatGPT, gemini ou claude? Tive essa visão de usar via container ou ollama dentro de um cluster para atividades específicas e controladas, assim devem ter calia, de outro modo, sempre me pergunto em pq bao usar o serviços prontos