Saturday, October 18, 2008

Paradoxo de Simpson

O paradoxo de Simpson é um paradoxo estatístico que ocorre quando o efeito total é positivo mas, quando dividimos em grupos, o efeito fica negativo (ou vice-versa).

Um exemplo interessante é dado a seguir:

Suponha que um médico queira analisar o efeito entre dois tratamento A e B para combater o calculo renal. Como resultados ele obteve: 78% (273/350) de curados usando o tratamento A e 83% (289/350) de curados usando o tratamento B.

Esses resultados indicam que o tratamento B é "melhor" que o tratamento A. Contudo, o pesquisador percebeu que deveria levar em conta o tamanho da pedra e, assim, separou os indivíduos com pedra pequena e pedras grandes. Os resultados seguem:

Tratamento A

Pedras pequenas 93% (81/87) de curados.
Pedras Grandes 73% (192/263) de curados


Tratamento B

Pedras pequenas 87% (234/270) de curados.
Pedras Grandes 69% (55/80) de curados.

Analisando os resultados. Se olharmos para os resultados dos pacientes com pedra pequena verificamos que o tratamento A é "melhor" que o tratamento B. Se olharmos para os resultados dos pacientes com pedra grande verificamos também que o tratamento A é melhor que o tratamento B. Ou seja, para qualquer tamanho de pedra o tratamento A é "melhor" que o tratamento B e chegamos a uma contradição com a afirmação inicial.

Neste exemplo em especial, o paradoxo ocorre por falha do pesquisador. Ele deveria ter fixado a priori os grupos e ter retirado uma amostra balanceada (na verdade pode ser desbalanceada mas tem um limite para que o paradoxo não ocorra). O pesquisador sabia que o tratamento A era mais eficaz e alocou os pacientes com pedras grandes (que são os casos mais severos) para este tratamento. Esse foi o erro do pesquisador.

Imagine agora que o experimento foi feito utilizando uma amostra balanceada e fazendo tudo como manda o figurino, os resultados obtidos ainda podem ser totalmente inválidos. Pode haver uma variável que não foi considerada no modelo que dentro daquele nível as conclusões se invertam (supondo que o novo experimento seja balanceando para o último nível), claro que o paradoxo de Simpson não irá ocorrer em cada experimento mas as conclusões de cada experimento poderão ser diferentes. Mais ainda... Suponha os seguintes experimentos:

Quero verificar quais dos dois tratamento é mais eficiente A ou B. Então eu pego uma amostra aleatória balanceada para cada tratamento e verifico as proporções de cura, suponha que, sob esse experimento, o tratamento A mostrou-se mais eficaz que o tratamento B. Depois eu percebo que deveria ter levado em conta um determinado evento C1. Então eu aplico cada tratamento dentro de cada nível C1 e C1* (* = complementar) usando uma amostra balanceada neste nível. Suponha que os resultados inverteram e agora o tratamento B mostrou-se melhor. Um outro pesquisador disse que o evento C2 deveria ter sido considerado, então reamostramos os pacientes tornando balanceada a amostra dentro do último nível, ou seja, os grupos (C1 inter C2), (C1 inter C2*), (C1* inter C2), (C1* inter C2*) devem ter o mesmo tamanho amostral. Neste experimento os resultados voltaram a mostrar que o Tratamento A é "melhor". Podemos ficar mudando de conclusão indefinidamente inserindo outros eventos C3, C4, ....

Note que o paradoxo de Simpson não irá ocorrer em cada experimento mas de experimento para experimento as conclusões são "paradoxais" (diferentes).

Outro exemplo

Suponha que duas pessoas, Lisa e Bart, cada um edita artigos da Wikipédia por duas semanas. Na primeira semana Lisa melhora 60% dos artigos que ela edita, enquanto que Bart melhora 90%. Na segunda semana, Lisa melhora apenas 10% dos artigos que ela edita enquanto que Bart 30%.

Nas duas semanas, Bart melhorou muito mais artigos do que Lisa. Contudo, vejamos os resultados:

Lisa
1ª semana 60%(60/100) dos 100 artigos editados, Lisa melhorou 60.
2ª semana 10% (1/10) dos 10 artigos editados, Lisa melhorou apenas 1.

Total combinado 55.5%(61/110). Ou seja, de 110 artigos que Lisa editou ela melhorou 61.

Bart
1ª semana 90% (9/10). Dos 10 artigos editados, Bart melhorou 9.
2ª semana 30% (30/100). Dos 100 artigos editados, Bart melhorou 30

Total combinado 35.5% (39/110). Ou seja, de 110 artigos que Bart editou, ele melhorou 39.

Resumindo, no total Lisa melhorou muito mais artigos que Bart, mas Bart melhorou muito mais artigos por semana. Qual dos dois melhorou mais artigos? Pode-se usar argumentos a favor de Bart e de Lisa. Talvez a resposta mais correta é que eles são incomparáveis, pois os artigos não são os mesmos e muitas outras variáveis de confundimentos estão presentes.

Para mais informaçães, sobre esses exemplos e outros visite o site da Wiki

3 comments:

Leo Bastos said...

Outro exemplo do Paradoxo de Simpson:

Radelet, M., Racial characteristics and imposition of the death penalty, American Sociological Review, 46, 918-927, 1981

White Victim

Death penalty Yes No
White Defendant 19 132
Black Defendant 11 52

Black Victim

Death penalty Yes No
White Defendant 0 9
Black Defendant 6 97

Nos dois casos a proporcao de negros acusados a pena de morte e' maior que a de brancos. No entanto, se ignorarmos a raca da vitima, temos o paradoxo de Simpson, pois a proporcao de brancos acusados a pena de morte e' maior:

Death penalty Yes No
White Defendant 19 141
Black Defendant 17 149

Anonymous said...

Muito bom o texto!

Lael lima said...

Que soma bizarra foi essa? 60/100+1/10=61/110?? Meio errado!
Na verdade, 60/100+1/10=6/10+1/10=7/10.

90/100+30/100=9/10+3/10=12/10.