Nébula Rasa

Por que gráficos de COVID-19 em escala logarítmica são uma má ideia

Tenho notado uma tendência preocupante na mídia em relação aos gráficos de COVID-19. Quase todas as agências estão apresentando estatísticas da pandemia em uma escala logarítmica. Se você é um pesquisador, editor, repórter ou blogueiro de ciências cujo trabalho é ajudar o público a entender os dados da pandemia com gráficos e outros recursos visuais, continue lendo. Mostrarei meu caso em favor da escala linear e explicar por que não usá-la é uma má ideia quando se trata de dados de pandemia.

O caso da escala logarítmica

Em primeiro lugar, por que alguém deveria usar a escala logarítmica? Um dos principais motivos é quando nossos dados têm um intervalo muito grande e a escala linear acaba comprimindo valores menores “como se tirássemos o zoom”. Evitar este efeito é fundamental se estivermos interessados ​​em retratar a taxa relativa de mudança em vez do valor absoluto.

Exemplo: suponha que desejamos investigar os altos e baixos do preço das ações da Tesla (veja a figura abaixo). Teríamos dificuldade em observar nuances da flutuação de preços em uma escala linear devido ao pico em 2013. Observe como o preço subiu uma ordem de grandeza, esmagando a seção anterior da série temporal para a parte inferior do gráfico (esquerda). A escala logarítmica, por outro lado, preservou visualmente as variações do preço das ações (direita).

Figure 1: Preço das ações da Tesla em escala linear (esquerda) e escala logarítmica (direita).

Figure 1: Preço das ações da Tesla em escala linear (esquerda) e escala logarítmica (direita).

A escala logarítmica também é particularmente útil em aplicações como gráficos de absorbância, estatística, gráficos espectroscópicos e cenários especiais em epidemiologia .

O caso contra ele

Observe que todos as aplicações mencionadas até agora vêm de áreas específicas das exatas e biológicas. Pode ser uma surpresa para alguns, mas nem todos são graduados nessas áreas. Todos os outros que não estão familiarizados com logaritmos não entenderão gráficos logarítmicos. Essa deve ser razão suficiente para que a palavra “logarítmico” nunca apareça em uma peça cujo papel é informar o público em geral.

Mas os gráficos de registro podem ser complicados para todos, incluindo nerds das exatas como você e eu. A confusão é perfeitamente compreensível, pois até mesmo uma linha reta monotônica parece “desacelerar” quando mostrada em um gráfico log.

Figure 2: Uma taxa de infecção em linha reta imaginária plotada em uma escala linear e logarítmica.

Figure 2: Uma taxa de infecção em linha reta imaginária plotada em uma escala linear e logarítmica.

“Mas espere, a função linear não é uma boa analogia. As taxas de infecção são exponenciais e apareceriam como linhas crescentes retas em uma escala logarítmica.” Idealmente, sim, mas a curva de distribuição de pessoas infectadas em alguns países não é perfeitamente gaussiana. Algumas seções da curva serão subexponenciais devido a vários fatores ainda desconhecidos. Mas há uma coisa que pode certamente fazer as curvas de infecção parecerem linhas retas, e é o gargalo causado por testes insuficientes de SARS-CoV-2 (estou olhando para você, Brasil).

O exemplo abaixo usa números reais. São os mesmos dados mostrados em uma escala linear (esquerda) e logarítmica (direita). Por favor, dê uma olhada pelas lentes de alguém que não tem nenhum diploma em Exatas por um momento.

Figure 3: Fonte: Nosso mundo em dados

Figure 3: Fonte: Nosso mundo em dados

Um leitor imprudente que olha para o gráfico à direita está propenso a concluir que a taxa de mortalidade pandêmica no Brasil está diminuindo, enquanto a realidade conta uma história totalmente diferente. De acordo com CF Schmid e SE Schmid, gráficos devem cumprir certos objetivos básicos. Eles deveriam ser:

“(1) representações dos fatos precisas, (2) claras, facilmente lidas e compreendidas, e (3) concebidas e construídas de forma a atrair e manter a atenção.”

Se um gráfico dá uma falsa impressão da realidade à primeira vista e é mal compreendido por uma fração considerável da população, isso deveria levantar uma série de bandeiras vermelhas. Então, por que a maioria dos jornais ainda insiste em usar a escala logarítmica nesses casos?

Quando dados de países de tamanhos diferentes começaram a chegar aos jornais, ficou claro que a imprensa adotou escalas logarítmicas para fazer com que várias curvas coubessem perfeitamente em um único gráfico. Mas os responsáveis ​​por informar o público nunca devem fazer embelezar um gráfico às custas de uma interpretação correta. Existem maneiras melhores de enfeitar seu artigo com dados abrangentes sem distorcê-lo: usando vários gráficos, por exemplo, ou comparando países com realidades semelhantes, ou - minha alternativa preferida - usando números relativos como “X por milhão de pessoas” (veja abaixo )

Então, por favor, faça gráficos de pandemia em uma escala linear, use máscaras e fique seguro.

Referências

Schmid CF, Schmid SE. Manual de apresentação gráfica. Nova York: John Wiley & Sons, 1954.

Veja também