Salve, filipedeschamps! Obrigado pelo feedback! 😁
Então, pelo que entendi, o endpoint de content
só retorna os posts pais e suas respectivas estatísticas. Nenhum dos dados obtidos por este endpoint tem parent_id
diferente de null
, i.e. são todos nulos.
Fiz um bate de números para alguns posts, e o valor de TabCoins para eles bate com o que está no campo tabcoins
que a API retorna, e é este mesmo campo que utilizei para somar as TabCoins:
select owner_username,
count(distinct id) as qtdContent,
sum(tabcoins) as qtTabcoins,
sum(tabcoins) / count(distinct id) as qtTabCoinsContent
from bronze.tabnews.contents
group by 1
order by 3 desc
limit 10
Acho que temos como oportunidade navegar post a post para pegar todos os posts filhos, hehe.
Boa, correto! Por padrão o endpoint /contents
vai assumir stragegy=best
e é o que está sendo utilizado na Home 🤝
Outra estratégia que você pode utilizar para o scraping é o stragegy=new
que irá listar as publicações de forma descrescente, veja:
https://www.tabnews.com.br/api/v1/contents?strategy=new&page=1
E caso queira pegar tudo de um usuário (tanto publicações root
quanto child
):
https://www.tabnews.com.br/api/v1/contents/filipedeschamps?strategy=new&page=1