Guias de visualização de dados (e 100 formas diferentes de visualizar os mesmo dados)

Visualização de dados é algo importante, e sinto que muitas vezes o responsável por exibir alguma informação (que está num conjunto de dados) escolhe a visualização pela beleza, e não pela função. Acho que é um tema que as pessoas estudam pouco.

Apesar de ser um assunto muito profundo e difícil, encontrei dois sites que podem quebrar um galho para quem quer estudar algumas formas de visualização ou encontrar uma para apresentar algo específico.

Dataviz Project

O Dataviz Project apresenta diferentes formas de visualização de dados. É possível pesquisar diretamente pelo nome da visualização, mas também por meio de filtros como:

  • Família: gráfico, diagrama, geoespacial, plot e tabela.
  • Dados: percentuais, temporais, dado único, idade etc.
  • Função: comparação, visualização de conceito, correlação, distribuição, geolocalização, parte do todo, tendência ao longo do tempo. (esse me pareceu o filtro mais útil)
  • Forma: quadrado, círculo, linha, pictograma, mapa etc.

Existe uma página dedicada para cada visualização com a definição dela e em quais categorias ela se encaixa para cada filtro acima, além de vários exemplos de uso.

Veja, por exemplo, o Heat Map. O site apresenta uma breve descrição, mas com diversos exemplos dessa visualização.

Página do Heat Map

Dataviz Catalogue

O segundo site que trago aqui é o Dataviz Catalogue. Seus filtros são mais simples do que os do Dataviz Project (possui apenas filtro por função), mas uma explicação mais aprofundada sobre as visualizações.

Nos detalhes sobre a visualização, existe a descrição, que indica quando a visualização é útil, quais os pontos fracos, detalhes da legenda, o que cada parte da visualização representa, exemplo de quando utilizar etc. Também tem a anatomia da visualização, que apresenta de forma visual quais são os componentes que a formam, podendo apresentar diferentes formas de uso.

Além disso, existe uma seção para visualizações similares, ferramentas para gerar a visualização (bibliotecas de diferentes linguagens, aplicativos web e desktop), funções e exemplos. Se você pretende usar (ou implementar!) essa visualização, as ferramentas indicadas podem ajudar bastante, apesar de ter pouco destaque na página por ser apenas uma lista de links.

Veja a página do Heat Map:

Página do Heat Map

Os dois sites se complementam. O Dataviz Project me pareceu muito melhor na questão de exemplos, enquanto que o Dataviz Catalogue é bem melhor na descrição e explicação da visualização.

Se você não tem familiaridade nenhuma com visualização de informação, talvez o melhor caminho seja explorar as visualizações pelo Dataviz Project, e quando encontrar uma que deseja se aprofundar mais, procurar no Dataviz Catalogue.

100 formas de visualizar os mesmos dados

Como um bônus, o Dataviz Catalogue possui uma página com 100 formas de visualizar o mesmo conjunto de dados, onde ao clicar em cada visualização, você pode ver a imagem ampliada com uma breve descrição abaixo.

É um conjunto de dados super simples, de três dimensões, representando a quantidade de patrimônios mundiais presentes em três países diferentes, em dois anos diferentes:

Noruega Dinamarca Suécia
2004 5 4 13
2022 8 10 15

É uma experiência de criatividade muito interessante. Obviamente, várias visualizações tornam difícil o entendimento dos dados, mas é interessante ver as possibilidades, porque às vezes você precisa de algo mais chamativo, diferente, ou então quer transmitir um outro aspecto dos dados que as formas comuns de visualização não deixariam claro.

Vou dar um exemplo prático. Se alguém fosse apresentar esses dados para você, muito provavelmente a forma escolhida seria com um gráfico de barras. O exemplo abaixo é um gráfico de barras empilhadas:

Gráfico de barras empilhadas

O eixo Y representa a quantidade, o eixo X representa os anos, e as cores, os países. É uma forma clara de visualizar que "aumentou", mas já dificulta entender quanto que cada país aumentou, ou qual aumentou mais. Faz parte da visualização escolhida.

Uma outra forma de visualizar, ainda usando gráfico de barras, é a seguinte:

Gráfico de barras 3D

O eixo Y e as cores continuam representando a mesma coisa, mas agora o eixo X representa os países, com uma personalização com a bandeiras deles para facilitar a identificação, e o tempo é representado num "eixo Z", onde temos a barra de 2004 à frente da barra de 2022. Como todos os países tiveram um crescimento de patrimônios mundiais de 2004 para 2022, essa é uma boa visualização. Conseguimos comparar os países uns com os outros, e com si mesmos também. Mas aqui perdemos a capacidade de comparação do total.

Existem várias outras visualizações interessantes no site, mas a última que quero compartilhar aqui é uma visualização em degraus de escada (staircase steps).

Visualização em degraus de escada

Essa visualização não é clara, se você não souber sobre o que se trata. Uma legenda poderia ajudar. Diferentemente dos gráficos de barras, aqui não temos tanta noção do crescimento, e a comparação entre os países é diferente. O foco é mostrar que a Noruega ultrapassou a Suécia, e que a Dinamarca está bem à frente.

Como podem ver, diferentes visualizações para os mesmos dados transmitem informações diferentes. Dependendo do que você deseja informar e do tipo de dado que possui em mãos, existe uma visualização mais adequada.

Como um segundo bônus, deixo a recomendação do livro Como mentir com estatística, de Darrell Huff, que aborda uma parte desse assunto nos capítulos 5 e 6.