O paradoxo de Simpson
As análises da eficácia do combate à covid-19 devem ter em conta não apenas os valores globais, de casos e de mortes, mas também os números de testes feitos ou a distribuição etária da população.
Em 1951 Edward Simpson descreveu uma hipotética situação onde um determinado medicamento aumenta as hipóteses de sobrevivência quando é aplicado quer a pacientes do sexo masculino quer a pacientes do sexo feminino, mas, paradoxalmente, não aumenta as hipóteses de sobrevivência para a população em geral. A tabela que usou para exemplificar o caso é a seguinte, e é possível verificar que a probabilidade de sobrevivência aumenta com a medicação, de 57% para 62% no caso dos homens e de 40% para 44%, no caso das mulheres. Porém, e paradoxalmente, verifica-se que, com os dados usados por Simpson (descritos mais abaixo) o mesmo medicamento, quando aplicado globalmente à população desta amostra, não aumenta em nada as probabilidades de sobrevivência que se mantém em 50%, com ou sem medicação.
A verdade faz-nos mais fortes
Das guerras aos desastres ambientais, da economia às ameaças epidémicas, quando os dias são de incerteza, o jornalismo do Público torna-se o porto de abrigo para os portugueses que querem pensar melhor. Juntos vemos melhor. Dê força à informação responsável que o ajuda entender o mundo, a pensar e decidir.
Em 1951 Edward Simpson descreveu uma hipotética situação onde um determinado medicamento aumenta as hipóteses de sobrevivência quando é aplicado quer a pacientes do sexo masculino quer a pacientes do sexo feminino, mas, paradoxalmente, não aumenta as hipóteses de sobrevivência para a população em geral. A tabela que usou para exemplificar o caso é a seguinte, e é possível verificar que a probabilidade de sobrevivência aumenta com a medicação, de 57% para 62% no caso dos homens e de 40% para 44%, no caso das mulheres. Porém, e paradoxalmente, verifica-se que, com os dados usados por Simpson (descritos mais abaixo) o mesmo medicamento, quando aplicado globalmente à população desta amostra, não aumenta em nada as probabilidades de sobrevivência que se mantém em 50%, com ou sem medicação.
Em 1973, Eugene Hammel, um antropólogo da Universidade da Califórnia em Berkeley, analisou as estatísticas de admissão nos cursos de pós-graduação da universidade e verificou que 44% dos candidatos masculinos eram admitidos, mas apenas 35% dos candidatos do sexo feminino. Preocupado com a possível existência de políticas discriminatórias na universidade que, sendo pública, está sempre mais exposta a quaisquer questões que tenham a ver com discriminação, decidiu investigar a questão mais a fundo. Em Berkeley, como na maioria das universidades, as decisões de admissão dos candidatos são feitas pelos departamentos, uma vez que os candidatos apresentam sempre a candidatura a um determinado curso. Esta análise, por departamentos, revelou algo estranho: na maioria dos departamentos da universidade a taxa de admissão era mais alta para as mulheres do que para os homens, e nos restantes departamentos não existia diferença nas taxas de admissão, o que significava que, efectivamente, existia uma discriminação estatisticamente significativa a favor das mulheres, feita pelos departamentos.
Em Maio de 2020, três investigadores, do Instituto Max Planck e da Universidade de Cambridge, publicaram um artigo onde analisaram as taxas de letalidade para o covid-19 na Itália e na China, para um conjunto de cerca de 750 mil pessoas diagnosticadas com a doença. A taxa de letalidade é, simplesmente, a percentagem de pessoas que são afectadas por uma dada doença (neste caso, covid-19) que morrem como consequência da mesma. O objectivo desta análise era comparar o risco de morte por faixa etária, num esforço para melhor entender as consequências das diferentes abordagens ao problema. Verificaram que, com os dados que existiam até à data, a taxa de letalidade, para cada faixa etária, era mais baixa em Itália do que na China, o que parecia apontar para um superior desempenho do sistema hospitalar e dos mecanismos de tratamento da doença em Itália. Apesar disto, e paradoxalmente, a letalidade da doença, na amostra analisada, era quase o dobro em Itália do que na China.
Todos estes casos são exemplos de um aparente paradoxo, que veio a ficar conhecido como o paradoxo de Simpson, uma situação onde as tendências que se verificam em cada um de diversos segmentos se invertem quando se considera a população como um todo. No primeiro caso, um medicamento que melhorava a sobrevivência dos homens e das mulheres não tinha efeito quando aplicado à população em geral. No segundo caso, embora existisse uma discriminação positiva a favor das mulheres pelos departamentos, a taxa de aceitação global era menor para as mulheres do que para os homens. E no terceiro caso, embora os hospitais em Itália tivessem mais sucesso no tratamento do covid-19, para cada faixa etária, tinham menos sucesso globalmente do que os hospitais na China. Em todos os casos, existem tendências em segmentos da população que, quando analisadas em conjunto desaparecem ou invertem-se. Para perceber o paradoxo, é necessário analisar os dados que Simpson originalmente usou como exemplo, não em termos de percentagens, mas em termos de valores absolutos.
Estes números correspondem às percentagens da tabela anterior. Por exemplo, a percentagem de sobrevivência dos homens aumenta de 4/7 (57%) para 8/13 (62%), quando tomam medicação. Porém, se somarmos os casos dos homens com os das mulheres, verificamos que a probabilidade global de sobrevivência não se altera e é sempre de 50%. Para os que não foram medicados, sobreviveram seis pessoas em doze. Para os que foram medicados, sobreviveram vinte pessoas em quarenta.
Como acontece na maioria dos paradoxos, o paradoxo de Simpson tem, geralmente, uma explicação que só se torna óbvia após uma cuidadosa análise dos dados. No caso da Universidade da Califórnia em Berkeley, veio a perceber-se a razão para as estranhas estatísticas. A explicação era que as mulheres concorriam, em maiores números, a departamentos com taxas globais de admissão menores (humanidades e ciências sociais). Os homens concorriam, pelo contrário, a departamentos com taxas de admissão maiores (engenharia e ciências) onde tinham mais sucesso. Globalmente, embora existisse discriminação positiva a favor das mulheres ao nível dos departamentos, a universidade admitia uma menor percentagem de mulheres do que homens. No caso do covid-19, o paradoxo explica-se porque a população em Itália é muito mais envelhecida do que na China, o que conduz a uma maior taxa de letalidade, pese embora a maior eficácia do sistema hospitalar italiano.
Para além da curiosidade intelectual, o que podemos concluir deste estranho fenómeno, onde as tendências de cada segmento não se reflectem na tendência global? Acima de tudo que é difícil comparar países, sectores ou instituições onde as distribuições das características relevantes são muito diferentes. Por exemplo, quando comparamos os números de mortos por covid-19, país a país, devemos ter em conta não só a dimensão do país, normalizando a análise por número de habitantes, como também a distribuição etária. Neste aspecto, o resultado que Portugal obteve até agora, com um baixo número de mortes covid por milhão de habitantes é particularmente meritório porque o nosso país tem uma das populações mais envelhecidas do mundo. De facto, Portugal é o quarto país do mundo com uma população mais envelhecida, atrás apenas do Japão, Itália e Finlândia. As análises da eficácia do combate à doença, que afectam decisões sobre a livre circulação de cidadãos, devem ter em conta não apenas os valores globais, de casos e de mortes, mas também os números de testes feitos, a distribuição etária da população e, possivelmente, outras características que variam fortemente de país para país.