Análise de Dados com GPT-4: Eu testei e você também precisa

A análise de dados é algo que existe em diversas profissões, para não dizer todas, e até mesmo no nosso dia a dia quando precisamos ir ao mercado ou avaliar a oferta x de um produto. Estamos sempre analisando os dados para tomarmos as melhores decisões.

Eu sou suspeito de falar desta área, pois o meu backend é todo formado em análise de dados: financeiros, marketing para rentabilização de clientes, análise de churn, retenção, atendimento, logística, vendas… Então eu levo bem a sério este negócio de: análise de dados.

Mas enfim, o que eu quero falar com você é sobre o meu primeiro teste e minhas primeiras percepções desta poderosa funcionalidade que a OpenAI implementou e já disponibilizou para todos (assinantes do GPT Plus e não assinantes como eu) nesta segunda, 06/11/2023.

Antes de Continuar...

Agradeço o espaço por compartilhar tal experiência com vocês. E se você quiser ver o artigo original com imagens do experimento está aqui.

Continuando...

Assistants: É onde tudo começa

“Assistants” ou Assistentes em português é a nova funcionalidade atribuída aos modelos GPT-3.5 Turbo e GPT-4 que permite a qualquer usuário utilizar o ChatGPT para responder perguntas relacionadas aos seus próprios documentos, ou melhor, à sua base de dados.

Essa é uma virada de jogo muito grande na minha opinião, pois abre portas para estudantes que querem estudar para o vestibular por exemplo, subirem as provas e pedirem ao Jarvis, (ops, Jarvis não, pois este é o nome do meu assistente, rs) que explique melhor as questões, faça um quiz, compare a sua resposta com a resposta certa etc.

Permite que um dono de e-commerce, que ainda não tem condições de ter uma área de BI na sua empresa, subir a sua base de vendas e assim conseguir tomar melhores decisões para alavancar o seu negócio.

Testando o GPT-4

Bem entusiasmado com esta novidade de poder subir uma base e fazer perguntas relacionadas a ela, logo pensei em buscar uma base de vendas, algo pequeno para ser usado como laboratório.

Em um repositório público, peguei uma base de vendas do Olist (grande marketplace), mais precisamente a base de vendas somente com os “sellers”, ou seja, os vendedores do Olist de um determinado período, assim, eu poderia subir rapidamente e efetuar os meus testes, uma vez que a base era pequena.

Esta base tem aproximadamente 3k registros com os dados de CEP do vendedor, cidade, estado e ID (código do vendedor) do vendedor e então eu pensei, se esta base tem cidade e estado, vou pedir para ele gerar um gráfico por região, uma vez que esta informação não tem na base, assim, após configurar o meu assistente com o seu papel e nome, subi a base.

Não consegui subir um arquivo “xlsx” e nem “csv”, ambos deram erro.

Esta base estava em csv e quando fui subir deu erro: “arquivo não suportado”, bem como outro que estava em “xlsx”, então para garantir que não daria erro, converti o csv em json e aí sim, foi numa boa.

Com tudo pronto, lancei a minha primeira pergunta: “Crie um gráfico de barras que separe os vendedores por região do BR” e daí veio a minha primeira impressão positiva.

Como eu não havia lhe dado nenhum contexto, tipo: “Subi o arquivo x e quero você analise etc…” Ele respondeu: “Vou precisar acessar os dados para criar o gráfico de barras. Por favor, você poderia me falar mais sobre o arquivo que você enviou…”

Mas ainda para efeito de teste eu pensei: Não vou dar nenhuma explicação sobre a base e vou pedir para que ele se vire. rs, e assim o fiz. E para minha surpresa novamente, ele começou a processar e respondeu.

O que mais me chamou atenção?

Apesar de simples este teste, ele possuía uma pegadinha, que era a região. O arquivo tem dados de cidade e estado e não de região, o que naturalmente poderia “forçar” a IA a inventar algo ou trazer da sua base de conhecimento.

Na verdade, ele acessou a sua base de conhecimento sim, mas foi para trazer o seu conhecimento sobre as regiões do Brasil para que assim ele pudesse criar os agrupamentos necessários.

O resultado

O Jarvis fez esta análise com maestria, trazendo os dados em forma de lista, um relatório simples para que possamos ter uma ideia rápido do resultado e logo em seguida, desenhou o gráfico que pedi.

Considerações finais

Quem é um usuário mais avançado, tudo que contei aqui não lhe impressiona tanto, porque bibliotecas como LangChain, fazem isso com maestria, mas o grande ponto é: usuários avançados.

O LangChain requer conhecimento de de programação e mesmo para usar o LangFlow que é uma interfase no-code não é tão simples quanto usar o “Assistants”, pelo menos na minha opinião, então sim, o Assistant deixa o uso e criação de agentes ainda mais democráticos.

Como acessar o Assistants?

Vixe! Já ia esquecendo do principal, para você usar Assistants, basta acessar o playground da OpenAI e se divertir.