Bom dia NobreLucas,

Uma dúvida sincera, qual é a diferença para o sklearn?

A minha pergunta é porque eu não consegui ver uma grande diferença e acho que muitas outras bibliotecas explicativas de modelos usam o sklearn como base.

Bom dia!

Agradeço a sua dúvida. Vou tentar explicar da melhor maneira possível.

O sklearn trabalha com dados em lote e com um modelo tradicional, ou seja o modelo não é incremental. Depois que ele é treinado, se você quiser que ele se adapte a novos dados você tem que treinar ele do zero.

Já o River segue uma abordagem "online". O nome pode trazer confusão, mas entenda um modelo online como aquele que trabalha com dados em streaming, ou seja o modelo é incremental. Assim que dados novos chegam ao modelo, ele é treinado com esses dados novos sem precisar revisitar os dados antigos.

Se você quiser saber mais detalhes, recomendo fortemente ler o meu primeiro artigo aqui no tabnews sobre aprendizado de máquina online. Vou deixar o link para você: Introdução ao Aprendizado de Máquina Online.

A leitura é de cerca de 3 minutos, então vale muito a pena :)