Excelente trabalho teomewhy! As ferramentas para datalake da AWS são muito boas, não só para estatística, como também para otimização de processos. Na empresa onde eu trabalho, conseguimos otimizar um processo importante de negócio (que não posso dar detalhes aqui, por questão de segurança) onde o processo demorava cerca de 12 horas para finalizar e conseguimos reduzir esse tempo para cerca 1h, somente utilizando datalake e lambda.

Da hora de mais! Usar o Apache Spark como solução de engine de dados em memória ajuda muito a escalar o processamento, de forma barata. Gosto bastante hehe.