Não estou familiarizado com as bibliotecas ou ferramentas que podem facilitar a vida de um analista de dados, por isso estou pedindo ajuda para encontrar algo que possa me auxiliar na extração dos dados. Os dados estão em formato bruto, no formato de log de eventos assim:
11/17 21:13:58.323 SPELL_AURA_APPLIED,Player-1425-07B0EE09,"Cloverzan-Drakkari",0x548,0x0,Player-1425-07B0EE09,"Cloverzan-Drakkari",0x548,0x0,154797,"Touch of Elune - Night",0x1,BUFF
11/17 21:13:58.323 SPELL_AURA_APPLIED,Player-1425-07B0EE09,"Cloverzan-Drakkari",0x548,0x0,Player-1425-07B0EE09,"Cloverzan-Drakkari",0x548,0x0,340546,"Tireless Pursuit",0x8,BUFF
11/17 21:13:58.323 SPELL_AURA_APPLIED,Player-1425-07B0EE09,"Cloverzan-Drakkari",0x548,0x0,Player-1425-07B0EE09,"Cloverzan-Drakkari",0x548,0x0,5487,"Bear Form",0x1,BUFF
E meu script o transforma em JSON, assim (isso abaixo é só uma linha convertida😅):
{
"timestamp": 1700266438.253,
"event": "SPELL_PERIODIC_DAMAGE",
"sourceGUID": "Player-3684-0DEBA294",
"sourceName": "Rawdogger-Mal'Ganis",
"sourceFlags": [
"AFFILIATION_OUTSIDER",
"AFFILIATION_MASK",
"REACTION_HOSTILE",
"REACTION_MASK",
"CONTROL_PLAYER",
"CONTROL_MASK",
"TYPE_PLAYER",
"TYPE_MASK"
],
"sourceRaidFlags": [],
"destGUID": "Player-1171-0A9765E1",
"destName": "Zuberion-WyrmrestAccord",
"destFlags": [
"AFFILIATION_PARTY",
"AFFILIATION_MASK",
"REACTION_FRIENDLY",
"REACTION_MASK",
"CONTROL_PLAYER",
"CONTROL_MASK",
"TYPE_PLAYER",
"TYPE_MASK"
],
"destRaidFlags": [
"AFFILIATION_PARTY",
"AFFILIATION_MASK"
],
"spellId": "391191",
"spellName": "Burning Wound",
"spellSchool": [
"Fire",
"Nature",
"Frost",
"Shadow",
"Arcane"
],
"amount": 0,
"overkill": "9020",
"school": [
"Frost"
],
"resisted": 0,
"blocked": 1292.99,
"absorbed": 1677.99,
"critical": true,
"glancing": true,
"crushing": true
}
Estagiario
,
Como você está iniciando, eu sugeriria você colocar em um DataFrame de polars (ou pandas que seria mais fácil pra quem está iniciando) e depois você vai explorar os dados.
Minha sugestão é que por enquanto você tire campos que sejam listas e foque nos que facilitam criar o dataframe.
Depois pode pegar uma biblioteca de exploração como o PandasProfiling, por exemplo (mas aí o dataset tem que ser em Pandas) ou o PyGWalker.