Estagiario
,
Como você está iniciando, eu sugeriria você colocar em um DataFrame de polars (ou pandas que seria mais fácil pra quem está iniciando) e depois você vai explorar os dados.
Minha sugestão é que por enquanto você tire campos que sejam listas e foque nos que facilitam criar o dataframe.
Depois pode pegar uma biblioteca de exploração como o PandasProfiling, por exemplo (mas aí o dataset tem que ser em Pandas) ou o PyGWalker.
Desde o início, tenho me concentrado exatamente nisso. No entanto, como vou transformá-lo em um dataframe se os dados não estão estruturados? O arquivo de log é bastante complexo, como eu exemplifiquei. É como se fosse um diário que registra tudo o que acontece no jogo World of Warcraft. Ele nos diz quem fez o quê, quando e onde no jogo. Por exemplo, se um personagem chamado "Kizradath" lançou um feitiço chamado "Arena Preparation", o log registra isso, mas de uma forma muito bagunçada, como se todas as informações estivessem misturadas. Portanto, minha primeira tarefa é separar e organizar esses registros para que possamos entender melhor o que está acontecendo e, só então, conseguiremos criar um dataframe.