Fichamento 03 | Por Émerson Rodrigues
Estatística para Ciências Humanas - Jack Levin
Capítulo 7 - Amostras e populações
Logo no início do capítulo 7, Jack Levin inicia a discussão com os conceitos de População e Amostra, utilizando-se de exemplos comuns como a quantidade de estudantes de uma universidade ou membros de um sindicato X. Ele define então população - ou universo - como sendo um conjunto de indivíduos que possuem, pelo menos, uma característica em comum.
Em virtude de o pesquisador não ter nem tempo nem recursos econômicos suficientes para fazer pesquisas com 100% dos indivíduos de um determinado grupo, ele pôs-se a estudar apenas uma amostra desse grupo, que seria um número menor de sujeitos tirados dessa população. Assim, a partir da amostra, o pesquisador busca tirar conclusões do grupo em que esta amostra foi extraída.
Dito isso, Levin destaca que o processo de amostragem está presente no nosso cotidiano. Aqui, a primeira ideia que vem a minha cabeça são as pesquisas eleitorais, encomendadas, em sua maioria, por jornais e institutos ligados ao mercado de ações. No dia do primeiro e segundo turnos das eleições, tais sondagens podem até não ser tão exatas, no entanto, não restam dúvidas de que elas trazem um importante parâmetro para os eleitores situarem seus candidatos dentro da corrida eleitoral, algo que tem tanto aspectos positivos quanto negativos.
Assista ao vídeo abaixo e entenda um pouco mais sobre os conceitos de população e amostra:
Neste tópico, Jack Levin ressalta que o pesquisador que trabalha com amostras utiliza técnicas mais elaboradas e sistemáticas de amostragem do que as comumente usadas no dia a dia, sempre com a preocupação de saber se sua amostra é bem representativa da população estudada. Assim, se todos os componentes de uma população tiverem igual oportunidade de participar da amostra, diz-se que o método usado é o da amostragem casual. Se não for o caso, fala-se então em amostragem não-casual.
Também conhecida como amostragem acidental, esta amostra se baseia com exclusividade no que convém ao pesquisador. Em outras palavras, o pesquisador simplesmente inclui os sujeitos convenientes na amostragem e exclui os inconvenientes.
Um tipo muito comum de amostragem não-casual é a de quotas, segundo Levin, em que diversas características de um população, como idade, sexo e classe social são amostradas nas mesmas proporções em que figuram na população. É esse, inclusive, o tipo de amostra utilizado nas pesquisas de intenções de voto. Assim, se a população brasileira é composta majoritariamente por mulheres, então, na amostra, deve-se ter, obrigatoriamente, mais mulheres do que homens.
Já a amostragem casual dá a cada membro da população igual oportunidade de fazer parte da amostra. Para essa amostra dê certo, Levin lembra que todos os sujeitos de uma população devem ser identificados antes da extração da amostra. Um exemplo de uma amostra casual simples é citado pelo autor de Estatística para Ciências Humanas. Quem nunca vendou os olhos para tirar um papel de amigo secreto de um recipiente que atire a primeira pedra.
Esse é o exemplo mais explicativo possível, visto que, ao vendar os olhos, nós temos a possibilidade de selecionar qualquer pessoa participante da brincadeira aleatoriamente. O pesquisador, entretanto, não retira nomes de um chapéu, mas utiliza de uma tábua de números aleatórios para conseguir êxito com sua amostragem.
Confira no vídeo abaixo os tipos de amostragem utilizadas em pesquisas científicas:
O objetivo de um pesquisador é tentar obter uma amostra que represente uma população na qual ele tem interesse. Dito isso, Jack Levin ressalta que amostras casuais simples dão mais representatividade as características populacionais do que as amostras não-casuais, visto que aquelas dão a todos os membros da população a mesma oportunidade de seleção.
No entanto, é de se esperar sempre alguma diferença entre uma amostra, aleatória ou não, da população da qual ela foi extraída. Esse fator, conhecido como erro amostral, aparece tanto se a pesquisa for bem executada ou não, apesar das boas intenções do pesquisador.
Distribuição Amostral de Médias
Levin inicia esse outro tópico com uma pergunta que muitos alunos devem tê-lo feito ao se deparar com um erro amostral: como é possível generalizar de uma amostra para uma população? Antes de seguir para essas discussões, o autor, porém, afirma que é necessário examinar algumas características de uma distribuição amostral de médias.
São elas: a distribuição amostral de médias aproxima-se da curva normal; a média de uma distribuição de médias amostrais é igual à verdadeira média populacional, ou seja, se calcularmos a média das médias amostrais teremos média igual ao valor da verdadeira média populacional; e o desvio padrão de uma distribuição de médias amostrais é menor do que o desvio padrão da população.
A Distribuição de Médias Amostrais Vista como uma Curva Normal
Diante das explicações, a curva normal então pode ser considerada uma distribuição de probabilidades, indo da probabilidade mais “baixa” até a mais “alta”. Diante disso, podemos dizer que as probabilidades decrescem à medida em que nos distanciamos da média das médias, isto é, da verdadeira média populacional.
Na prática, segundo Levin, o pesquisador raramente faz coleta de dados de mais do que uma ou duas amostras, a partir das quais ele ainda deseja generalizar para a população toda, afinal, “extrair uma distribuição de médias amostrais requer o mesmo esforço que o de estudar individualmente cada membro da população”.
Diante disso, ele não teria como estimar qual o desvio padrão e a média das médias de sua distribuição amostral. Levin destaca, contudo, que o estudioso possui um bom método para estimar o desvio padrão a partir dos dados que lhe fornecem uma única amostra. Tal estimativa é conhecida como erro padrão da média.
“Com a ajuda do erro padrão da média, podemos encontrar o intervalo de valores dentro do qual a verdadeira média populacional pode cair. Podemos, também, estimar a probabilidade com que a nossa média populacional realmente cairá dentro desse mesmo intervalo (de valores de médias). Este é o conceito de intervalo de confiança”.
Na tomada de decisões estatísticas nunca há possibilidade de ter certeza absoluta. O uso do intervalo de 95%, por exemplo, quer dizer que há 95 possibilidades em 100 de estar-se correto. No entanto, devemos sempre ter em mente que a média amostral do pesquisador poderia ser uma daquelas 5 possibilidades em 100 que caíram fora do intervalo estabelecido.
Uma coisa importante de se dizer é que, quando aumentamos o intervalo de confiança de uma amostra, mais é difícil estimar a verdadeira média populacional. Por isso, o estudioso deve escolher entre estar correto com maior precisão ou estar correto com maior confiança.
Não raro o pesquisador procura obter uma estimativa duma proporção populacional a partir de outra proporção resultante do estudo de uma amostra casual. O maior exemplo disso são as pesquisas de intenções de voto, feitas antes das eleições. Quando um pesquisador anuncia que 45% dos brasileiros votarão em Fernando Haddad (PT), no entanto, ele reitera com convicção de que não está 100% correto. Em geral, as pesquisas de intenções de voto no Brasil, por exemplo, tem de 95% de intervalo de confiança.
LEVIN, Jack. Estatística para Ciências Humanas. 2004.