Opa, analista de dados aqui!

Cara, sendo bem sincero, o estado no qual o mercado se encontra pode ser bastante confuso. A área de Ciência de Dados ainda não está bem definida, pelo menos não aqui no Brasil. As funções de cada um dependem muito das necessidades da empresa e do quanto ela está disposta a investir nesse setor.

Não é incomum em empresas pequenas você ver um Analista de Dados fazendo o trabalho que um Engenheiro de Dados ou de um Cientista de Dados fariam em outras empresas. Por outro lado, há também empresas onde os cargos são bem específicos, uma vez que os times são maiores e cada profissional pode se especializar mais em algum tema.

Minha dica é que você não se apegue ao título, mas sim às funções quando for procurar a vaga. Procure entender o que esperam que você faça e veja se faz sentido pra você.

Recrutadores tendem a buscar pessoas mais pelas habilidades técnicas do que pelo nome do cargo (exemplo: alguém que saiba Python, Spark, SQL...), até porque deve ser difícil buscar alguém para posições relativamente recentes, como "Engenheiro de Machine Learning" ou outros cargos "nichados". Então busque se desenvolver aprendendo tecnologias com as quais você pretende trabalhar pra poder atuar nessas áreas.

Fala aí Galdino!

Concordo com o csant que no Brasil existe muita confusão de nomenclatura.

Atualmente sou cientista e já fui analista.

Geralmente a regra é:

  • Engenheiro: Trabalha com a infraestrutura dos dados.
  • Analista: Trabalha com dados passados para gerar insights, geralmente utiliza muito ferramentas de BI e dispõe de maneira que o negócio consiga obter as respostas que necessitam.
  • Cientista: Utiliza de artigos científicos para responder problemas de negócios e modelos estatísticos para prever cenários antes mesmo que ocorram, dando a oportunidade de escolher o mais "promissor".

Comece a se aprofundar na análise exploratória, limpeza de dados e modelos.

Crie portfólio de classificação supervisionada e se arrisque nas vagas, nunca vamos estar 100% preparado para uma vaga de cientista rsrs

Pode explicar melhor a ideia de criar portfólio de classificação supervisionada?
Existem os datasets classicos de classificação como o do Titanic, iris e preço de casa, tenta usar esses que estão mais batidos ou algum que não seja tão utilizado (seria melhor), para fazer um artigo mostrando as suas analises, insights e no final o modelo com as métricas (Recall, Precision, F1)