Análise de Dados, Phyton x PowerBI Vantagens e Desvantagens.
Trabalho a mais de 5 Anos com Qlikview desde o projeto, mapeamento de regras de negócios, ETL até montagem e publicação do dashboard para visualização de dados.
Como o Qlikview foi descontinuado e enfim minha empresa está pensando em migrar para outra solução, estou estudando Phyton, Qliksense e PowerBI.
Tá certo que ainda estou na metade de curso de Phyton... Mas o trabalho que dá para fazer coisas que são "drag'n drop" em ferramentas de mercado, e pensando em como será trabalhar com uma estrutura de dados multidimensional, indicadores com múltiplas expressões, filtros e regex me faz questionar o quão prático é trabalhar com Phyton no dia a dia para análise e visualização de dados.
Estou sendo precipitado?
Fala Neaw, trabalho com análise de dados há 4 anos, e outros 8 anos tendo python como minha principal linguagem de desenvolvimento.
Trabalhei com Python e Clikview em outra instituição, mas hoje na empresa onde estou utilizamos PowerBi, Python e R.
Sobre as ferramentas, quando troquei de empresa demorou um tempinho para me adaptar e entender tudo que era possivel fazer no PowerBi e confesso que após dois anos ainda não utilizo grande parte do que me dispôe.
Sobre qual utilizar, entendo que a dinamicidade de visualização e controles de acesso em dashboards ou até mesmo de segmentação de acesso dentro de cada dash, o PowerBi não deixa nada a desejar, é mesmo muito bom, principalmente quando em algum cenário você irá apresentar essas informações a pessoas que talvez não tenham tanta experiência e vivencia com manipulação de gráficos e planilhas.
Para a construção e processamento desses dados, o PowerBi vai te disponibilizar o Power Query onde vai poder manipular suas tabelas com dax e também te possibilita utilizar Python e R dentro do próprio Power Bi, que são ferramentas muito boas, mas dependendo sua estrutura de dados, sua infra e a quantidade de informação que vai manipular, pode deixar o sistema bem pesado e até lento em alguns momentos.
No meu cenário, ficou impraticável utilizar apenas o PowerBi para a coleta, processamento e disponibilização dos dados, por tratar de tabelas muito grandes com muito processamento e muitos acessos simultâneos. Utilizamos aqui o Python e/ou R para todo o processo de construção da informação, esses scripts rodam durante a madrugada ou antes do inicio das atividades, e depois o Power Bi atualiza os dashboards publicados a partir das informações geradas pelos scripts....
Um ponto a observar também é onde armazenar estes dados processados até o PBI fazer a atualização. Ai depende da sua realidade, você pode exportar um CSV e fazer o PBI olhar pra esse arquivo para atualizar, ou pode alimentar um banco de dados qualquer que você tenha disponível.
Finalizando, são todas ferramentas incriveis e realmente recomendo o uso simultâneo delas, então talvez pra resumir isso tudo, ao invés de Python X PowerBi por que não Python & Power Bi?