teomewhy

  1. TabNewsLake - Um Datalake para nossas News
    25 tabcoins · 19 comentários · teomewhy · há 2 anos
  2. TabNews Race: a corrida em quantidade de posts
    21 tabcoins · 13 comentários · teomewhy · há 2 anos
  3. Machine Learning do início ao fim
    7 tabcoins · 7 comentários · teomewhy · ano passado
  4. Salve, Filipe. Poxa, fico feliz que estou conseguindo trazer algumas coisas legais usando os dados disponíveis na API. Para ser bem honesto, estou bem animado com o projeto e pensei em mais algumas possibilidades, como fazer um modelo de precificação c...
    2 tabcoins · 0 comentários · teomewhy · há 2 anos
  5. Poxa, ai vc já está dando spoiler do nosso próximo post hahaha Valeu demais o//
    2 tabcoins · 0 comentários · teomewhy · há 2 anos
  6. No primeiro momento pensei WTF esse post?. Mas no final acabei me identificando bastante hehe. Como venho da área de dados, uma palavra que sempre vejo empregada errada é Assertiva, remetendo à "o que é certo ou de forma correta" ou pelo verbo acertar....
    2 tabcoins · 1 comentários · teomewhy · há 2 anos
  7. Salve! Obrigado! Isso é uma ótima ideia, principalmente por eu não ter contato direto com o Terraform. Esse lake foi criado usando uma stack do cloudformation disponibilizado pelo Databricks. Na verdade eu criei o S3 via console e o ambiente do databri...
    2 tabcoins · 0 comentários · teomewhy · há 2 anos
  8. Salve, filipedeschamps! Obrigado pelo feedback! 😁 Então, pelo que entendi, o endpoint de content só retorna os posts pais e suas respectivas estatísticas. Nenhum dos dados obtidos por este endpoint tem parent_id diferente de null, i.e. são todos nulos...
    2 tabcoins · 3 comentários · teomewhy · há 2 anos
  9. Perfeito! Super respondido! Seria ótimo ter um endpoint ou critério para ordenar os contents pela atualização. Aproveito para perguntar, a atualização é referente à ediçãodo mesmo ou comentários e tabcoins também fazem a data de atualização ser alterad...
    2 tabcoins · 2 comentários · teomewhy · há 2 anos
  10. me manda uma msg no privado do linkedin para falarmos melhor por lá: https://www.linkedin.com/in/teocalvo/
    1 tabcoins · 0 comentários · teomewhy · há 12 meses
  11. Salve! Você pode ir no chat da twitch e digitar !email seu@email.com Se você já for assinantes, a liberação acontece em alguns minutos e você recebe um email para acessar o Databricks.
    1 tabcoins · 2 comentários · teomewhy · há 12 meses
  12. Salve, mano! É desse databricks que você está falando? O que ele oferece em comparação a distribuir os dados num arquivo .json, ou num notebook do kaggle, por exemplo? É esse Databricks sim. Ele acaba sendo uma plataforma para construção de datalake. F...
    1 tabcoins · 0 comentários · teomewhy · ano passado
  13. Opa, valeu pelo reconhecimento. :D Deu uma olhada no repositório? Espero conseguir continuar construindo coisas legais por lá. Faço questão de postar minhas evoluções em novos conteúdos por aqui.
    1 tabcoins · 0 comentários · teomewhy · há 2 anos
  14. Salve, lollipop! Você pode conferir todo nosso projeto de Datalake aqui: https://github.com/TeoMeWhy/TabNewsLake Mostramos tanto a coleta de dados, ingestão e tratamento para chegar neste resultado. ;D
    1 tabcoins · 0 comentários · teomewhy · há 2 anos
  15. Perfeito! No nosso script já utilizamos o strategy=new. A questão é que se um post (particularmente os mais antigos) é atualizado ou ganha mais Tabcoins, mesmo pegando por essa estratégia não vamos ter visibilidade, certo? A não ser que percorra sempre...
    1 tabcoins · 1 comentários · teomewhy · há 2 anos
  16. Da hora de mais! Usar o Apache Spark como solução de engine de dados em memória ajuda muito a escalar o processamento, de forma barata. Gosto bastante hehe.
    1 tabcoins · 0 comentários · teomewhy · há 2 anos
  17. Boa! Gostei da sua ideia de adicionar a issue. Coloquei aqui: https://github.com/filipedeschamps/tabnews.com.br/issues/1241 Fique a vontade para complementar ou sugerir maior clareza.
    1 tabcoins · 0 comentários · teomewhy · há 2 anos
  18. Salve! Muito legal essa documentação e API, pretendo utilizá-la. Sobre Obter conteúdos, os valores para old e new é em relação à criação do conteúdo ou à atualização do mesmo? Isto é, caso um conteúdo mais antigo e receba maior relevância ou respostas...
    1 tabcoins · 4 comentários · teomewhy · há 2 anos