Gráficos para NÃO usar

9 Agosto, 2019 Por Jessica

Por que gráficos de pizza e gráficos com dois eixos y não são recomendados?

A função de qualquer gráfico é, primordialmente, comunicar uma informação. Outro jeito de dizer a mesma coisa é que o gráfico deve traduzir dados em informações de forma visualmente fácil para quem recebe essa informação.

Portanto:

  1. Se um gráfico não traduz dado em informação, ele falhou no seu propósito;
  2. Se um gráfico traduziu dados em informação, mas confunde ou dificulta a interpretação do leitor, ele falhou no seu propósito.

Muito utilizados em jornais. revistas, aplicativos e dashboards, os gráficos de pizza e de dois eixos y caem nessas armadilhas. Hoje quero mostrar porque você deve evitá-los ou, quando se esbarrar com algum desses, que cuidados ter.

Ilusão idiótica dos gráficos de pizza

Imagine que uma empresa tem 4 vendedoras¹: A, B, C e D. Ela quer saber quem vendeu mais ou menos naquele mês. Para tanto, faz o seguinte gráfico de pizza:

O que este gráfico lhe informa? É evidente que D vendeu mais que A, B e C. Mas quanto mais? E os demais: Quem vem segundo lugar? Quão maior ou menor foram as vendas de B em relação a C ou D?

A dificuldade em interpretar quão maior ou menor é uma “fatia” em relação à outra está no fato de que para isso precisamos conseguir reconhecer qual a área desta fatia. Nosso cérebro não faz isso intuitivamente no caso de círculos!

Lembra da formula da área de circulo que aprendemos lá no colegial? Pi vezes o raio ao quadrado. Não é uma formula absurda, mas também não é trivial. Como a ideia do gráfico é simplifica, usar a forma circular e pedir para traduzir informação desta área, acrescenta complexidade ao invés de diminuir.

Agora vejamos os mesmos dados, representado num gráfico de colunas.

Além de visualmente mais organizado, esse gráfico dá uma noção muito mais clara de proporções. Vemos que D vendeu mais que todos e fica fácil concluir que foi em torno de 3 vezes mais que o segundo colocado A.

Comparar o 2º, 3º e 4º colocados também fica muito mais fácil.

A sensação de alívio quando transitamos do gráfico 1.1 para o 1.2 tem uma razão de ser. No gráfico de colunas, conseguimos fazer as comparações usando uma única medida: comprimento.

Basta notar qual coluna é mais longa que a outra – o que é muito mais intuitivo e não requer qualquer tipo de cálculo indireto. Saber se algo é mais “alto” ou “baixo” que outra coisa é uma tarefa trivial para nossos cérebros, diferente de comparar áreas em planos circulares.

Para quem quer algo diferente de um gráfico de colunas, há ainda o gráfico waffle. Particularmente, não gosto muito dele. Mas para mostrar proporções, traduz de forma visualmente muito superior ao de pizza, já que a tradução das proporções em “bloquinhos” não deixa margem para ilusões de ótica.

Cuidado com efeitos 3D!

Ainda sobre o gráfico de pizza, é comum ver publicações com gráficos de pizza em 3D e dispostos com perspectiva. Cada vez que fazem isso, um cientista de dados morre.

Veja o gráfico acima. As áreas azul e vermelha são as maiores. Por ser um gráfico de pizza já seria desafiador saber qual é maior e quão maior. Mas por conta da perspectiva da imagem, se torna impossível.

Confusão de gráficos com 2 eixos y

Outro gráfico que nos esbarramos às vezes por aí, são aqueles com dois eixos y: um a esquerda e outro a direita. No geral, são usados para juntar num mesmo gráfico duas séries temporais com variáveis de escalas diferentes.

A ideia desses gráficos é permitir comparar o movimento de duas séries diferentes numa mesma imagem. A questão é que essa facilidade pode gerar conclusões precipitadas.

Image que uma empresa que ver a relação entre unidades vendidas e renda média dos clientes a cada mês do ano¹. Ela faz o gráfico abaixo: No eixo y à esquerda temos a quantidade de unidades vendidas de determinado produto. No eixo y a direita temos a renda média ao mês.

Se olhadas separadamente, não haveria problemas. A questão é que gráficos assim são feitos para comparar as duas coisas. Como as escalas e unidades de cada eixo podem ser muito diferentes, existem os seguintes riscos:

  • Interpretar os pontos de intersecção (onde as curvas se cruzam) como uma informação relevante. Mas não são! Como as escalas são diferentes, esses pontos não dizem absolutamente nada.
  • Acreditar que existe correlação entre o movimento das curvas, principalmente quando eles são parecidos. Mas não há qualquer garantia de essa correlação existir!

Se a ideia é comparar as duas coisas, a recomendação é não fazer um gráfico com dois eixos y, mas sim gráficos de dispersão colocando uma das variáveis no eixo x (horizontal) e a outra no eixo y (vertical). Se quer observar isso no tempo, pode-se fazer um gráfico para cada período.

Ou ainda, fazer modelos de regressão para medir os coeficientes de um possível modelo e ver se são significantes. Só assim certificaremos que existe (ou não) algum grau de correlação entre as variáveis.

O gráfico abaixo faz isso para o gráfico 1.4 de dois y. Veja que no gráfico de 2 eixos y eramos induzidos a acreditar que há alguma relação entre Unidades vendidas e Renda, principalmente quando as curvas se cruzavam. Mas quando plotamos os dados com Unidade em X e Renda em Y para toda a série, vemos que os dados não seguem nenhum padrão. Se fazemos isso para cada mês, confirmamos que não há nenhum padrão dentro de cada período isoladamente também.

Ou seja, neste exemplo fictício, não há qualquer correlação perceptível entre Unidades Vendidas e Renda. Enquanto que o gráfico de 2 y dava essa falsa impressão.

Simples é mais!

O ponto central é o seguinte: Simples é mais!

Gráficos mais complexos existem e podem ser necessários. Mas para a grandíssima parte do que fazemos no dia a dia, gráficos de pontos, colunas e linhas dão conta do recado.

Lembre-se: a função primordial de um gráfico é comunicar informação de forma fácil e clara. Se um gráfico de colunas ou de pontos entrega isso, não há porque dispensá-lo por outro mais bonito, mas menos eficaz na comunicação 🙂

¹ Todos os dados são fictícios, a partir de uma base simulada.

² Gráfico horrendo de pizza em 3D extraído deste ótimo artigo do Business Insider.