teomewhy
- TabNewsLake - Um Datalake para nossas News
25 tabcoins ·
19 comentários ·
teomewhy ·
há 2 anos - TabNews Race: a corrida em quantidade de posts
21 tabcoins ·
13 comentários ·
teomewhy ·
há 2 anos - Machine Learning do início ao fim
7 tabcoins ·
7 comentários ·
teomewhy ·
há 2 anos - Salve, Filipe. Poxa, fico feliz que estou conseguindo trazer algumas coisas legais usando os dados disponíveis na API. Para ser bem honesto, estou bem animado com o projeto e pensei em mais algumas possibilidades, como fazer um modelo de precificação c...
2 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Poxa, ai vc já está dando spoiler do nosso próximo post hahaha Valeu demais o//
2 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - No primeiro momento pensei WTF esse post?. Mas no final acabei me identificando bastante hehe. Como venho da área de dados, uma palavra que sempre vejo empregada errada é Assertiva, remetendo à "o que é certo ou de forma correta" ou pelo verbo acertar....
2 tabcoins ·
1 comentários ·
teomewhy ·
há 2 anos - Salve! Obrigado! Isso é uma ótima ideia, principalmente por eu não ter contato direto com o Terraform. Esse lake foi criado usando uma stack do cloudformation disponibilizado pelo Databricks. Na verdade eu criei o S3 via console e o ambiente do databri...
2 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Salve, filipedeschamps! Obrigado pelo feedback! 😁 Então, pelo que entendi, o endpoint de content só retorna os posts pais e suas respectivas estatísticas. Nenhum dos dados obtidos por este endpoint tem parent_id diferente de null, i.e. são todos nulos...
2 tabcoins ·
3 comentários ·
teomewhy ·
há 2 anos - Perfeito! Super respondido! Seria ótimo ter um endpoint ou critério para ordenar os contents pela atualização. Aproveito para perguntar, a atualização é referente à ediçãodo mesmo ou comentários e tabcoins também fazem a data de atualização ser alterad...
2 tabcoins ·
2 comentários ·
teomewhy ·
há 2 anos - me manda uma msg no privado do linkedin para falarmos melhor por lá: https://www.linkedin.com/in/teocalvo/
1 tabcoins ·
0 comentários ·
teomewhy ·
ano passado - Salve! Você pode ir no chat da twitch e digitar !email seu@email.com Se você já for assinantes, a liberação acontece em alguns minutos e você recebe um email para acessar o Databricks.
1 tabcoins ·
2 comentários ·
teomewhy ·
ano passado - Salve, mano! É desse databricks que você está falando? O que ele oferece em comparação a distribuir os dados num arquivo .json, ou num notebook do kaggle, por exemplo? É esse Databricks sim. Ele acaba sendo uma plataforma para construção de datalake. F...
1 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Opa, valeu pelo reconhecimento. :D Deu uma olhada no repositório? Espero conseguir continuar construindo coisas legais por lá. Faço questão de postar minhas evoluções em novos conteúdos por aqui.
1 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Salve, lollipop! Você pode conferir todo nosso projeto de Datalake aqui: https://github.com/TeoMeWhy/TabNewsLake Mostramos tanto a coleta de dados, ingestão e tratamento para chegar neste resultado. ;D
1 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Perfeito! No nosso script já utilizamos o strategy=new. A questão é que se um post (particularmente os mais antigos) é atualizado ou ganha mais Tabcoins, mesmo pegando por essa estratégia não vamos ter visibilidade, certo? A não ser que percorra sempre...
1 tabcoins ·
1 comentários ·
teomewhy ·
há 2 anos - Da hora de mais! Usar o Apache Spark como solução de engine de dados em memória ajuda muito a escalar o processamento, de forma barata. Gosto bastante hehe.
1 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Boa! Gostei da sua ideia de adicionar a issue. Coloquei aqui: https://github.com/filipedeschamps/tabnews.com.br/issues/1241 Fique a vontade para complementar ou sugerir maior clareza.
1 tabcoins ·
0 comentários ·
teomewhy ·
há 2 anos - Salve! Muito legal essa documentação e API, pretendo utilizá-la. Sobre Obter conteúdos, os valores para old e new é em relação à criação do conteúdo ou à atualização do mesmo? Isto é, caso um conteúdo mais antigo e receba maior relevância ou respostas...
1 tabcoins ·
4 comentários ·
teomewhy ·
há 2 anos