Meus blogs e sites queridinhos sobre ciência de dados

Os meus blogs e sites favoritos relacinados à ciência de dados, AI, machine learning e estatística para data science 📚

São todos em inglês por um único motivo: eu estou empenhado em aprender inglês ao mesmo tempo em que estudo sobre ciência de dados 😅

Towards Data Science

Com um público diversificado e com autores independentes de diferentes níveis que vão do iniciante ao especialista no assunto.

O Towards Data Science conta com a ajuda de editores voluntários que são grandes especialistas no assunto como David Chen, Sophie Mann, Dimitris Panagopoulos, Manish Sharma e vários outros grandes nomes da ciência de dados ajudando na curadoria dos artigos que são revisados por eles.

Os artigos são de excelente qualidade e valor. Eu gosto de acompanhar os conteúdos sobre Python, Machine Learning e AI para estudá-los e entender a linha de raciocínio que o autor usa durante todo o projeto.

Distill

Foi uma revista científica que funcionou de 2016 à 2021 (lágrimas por ela ter acabado). Durante esse pouco tempo, eles tinham a proposta de compartilhar pesquisas científicas de uma maneira moderna, explorando novas maneiras de pensar e bem diferentes do modelo tradicional que sempre foi o PDF.

Muitos pesquisadores querem (precisam) expor seus trabalhos de uma maneira que não podem ser facilmente compreendidos por PDF's. Creio que a Distill tenha sido uma tentativa de democratização da pesquisa científica.

Vejam só esse trabalho que permite consertar uma rede neural diretamente no seu navegador 🤯. Aqui é feita a comparação entre o artigo científico publicado de uma maneira tradicional em PDF e uma outra maneira de mostrar o trabalho de forma mais visual e interativa.

Neural Network - concertando uma rede neural

Um dos trabalhos mais incríveis que eu encontrei nesse site foi sobre Comunicação com Artigos Interativos que ajudam a aumentar o aprendizado e o engajamento dos leitores. Dentro desse artigo eu encontrei um outro artigo explicando machine learning de maneira visual. Até hoje, foi uma das coisas mais incrivelmente bem feitas que eu vi por aí na internet.

Visual introduction to machine learning

Aqui os artigos são muito densos, coisa de cientista pesquisador mesmo 😅, mas creio que quebrar a cabeça para tentar entender todas essas coisas complexas é muito importante para quem gostaria de trabalhar com dados.

No Distill é onde você encontra explicações de projetos que integram matemática avançada, machine learning, AI, programação e pensamento crítico para resolver problemas complexos. Ou seja: lá é onde o filho chora e a mãe não vê!

CIO

CIO é Chief Information Officer, algo como um cargo de Diretor de TI 😗

Esse site atrai uma grande concentração de CIO's de tecnologia com insights e experiências estratégicas de negócio, inovação e liderança.

Aqui você encontra muita coisa sobre desenvolvimento de carreira, certificações, desenvolvimento de habilidades e transformação digital de negócios.

Navegue por todas as abas, innovation, data analytics & AI, enterprise applications, IT leadership, business operation, careers, cloud computing aaaaaaaaah é muita coisa boa em um só lugar!

No CIO você fica por dentro do que está acontecendo no mercado global de tecnologia, quais as novas estratégias que estão sendo adotadas pelas empresas, certificações e opções de carreira em tecnologia e novas aplicações tecnológicas de sucesso nas empresas. Tudo o que pode nos proporcionar uma boa visão de negócio.

Simply Statistics

O Simply Statistics foi criado por três professores de bioestatística, Jeff Leek, Roger Peng e Rafa Irizarry onde eles mostram como a estatística é usada no dia a dia para resolver problemas reais em várias áreas das nossas vidas juntamente com a ciência e análise de dados.

Um artigo deles que eu li e reli, pensei muito a respeito e fiz um pequeno resumo foi esse aqui sobre Como Cientistas de Dados Pensam - Um Mini Caso de Estudo.

Nesse artigo, Hilary Parker e Roger Peng discutem sobre como resolver um determinado problema usando a ciência de dados. Diferente de um "hackathon", onde você recebe um conjunto de dados já coletado e é desafiado a encontrar algo interessante nos dados. Nesse caso eles começam com um problema e depois falam sobre como os dados podem ser coletados e analisados para resolver esse problema em específico.

Embora ambas as abordagens possam resultar no mesmo produto final, elas abordam os vários problemas que você encontra em uma análise de dados em uma ordem diferente.

Vale mencionar o Kaggle como fonte, e vou deixar uma fonte de artigos aqui tbm, acompanhados de codigo. https://paperswithcode.com/