Saturday, October 18, 2008

Por que aleatorizar?

Alguns ainda afirmam que aleatorizar não é necessário. Veja o argumento:

Suponha que eu queira escolher 4 alunos de uma classe de 20 alunos (homens) para medir suas alturas. Eu resolvo escolher João, Márcio, Cléber e Léo. Então anoto suas respectivas alturas, tiro a média e faço minhas inferências para a turma toda. Não contente com meus métodos o professor Jatobá (nome fictício apenas para ilustrar o exemplo) disse que eu deveria aleatorizar a amostra. Então ele faz um algoritmo em algum programa estatístico para retirar "aleatoriamente" (na verdade é pseudo-aleatório, mas esqueçam isso por alguns segundos) os 4 alunos. Por acaso saíram os mesmos alunos que eu selecionei: João, Márcio, Cléber e Léo. E ai? porque eu estou errado e ele certo se os resultados são os mesmos?

Bom, se a população que estamos estudado for extremamente homogênea, então tanto faz selecionar aleatoriamente ou intencionalmente. O grande problema é que isso não ocorre na prática. Sempre teremos algum subgrupo escondido na população que é bem homogêneo dentro dele e que difere dos outros grupos que formam a população. Mesmo estratificando sua população ao nível máximo conhecido nunca teremos certeza de que ainda existe algum outro subgrupo que seria necessário estratificar.

Porque aleatorizar?

Porque não temos controle de tudo e assim evitamos escolher apenas indivíduos dentro de um subgrupo que não temos consciência de que ele difere dos demais. Ou seja, aleatorizamos para evitar um viés na amostra. Além disso, esse esquema permite que a análise seja replicável por outras entidades. Esta última característica é extremamente desejável em ciência, onde os experimentos devem ser replicáveis para que outros pesquisadores verifiquem sua validade.

Um dos problemas debatidos entre os estatísticos é o método de amostragem utilizado nas eleições. Sabe-se que as instituições não retiram uma amostra probabilística, entretanto utilizam os métodos estatísticos que supõem amostras probabilísticas. A amostra geralmente é retirada por cotas e não tem validade científica, pois não é possível calcular o erro-padrão nem mesmo saber se as estimativas são não-viciadas. Uma discussão interessante sobre o tema que fala sobre a falsidade das margens de erro de pesquisas eleitorais feita pelos Professores José Ferreira de Carvalho (Professor aposentado da UNICAMP) e Cristiano Ferraz (Professor da UFPE) pode ser vista aqui.

No comments: