Discover Top Posts Tagged with #amostragem

As pesquisas erraram? | com Andrei Roman | 149

No dia 2 de outubro, no que a apuração das eleições avançava, avançava também a surpresa. Muitos resultados diferiam bastante do esperado. As pesquisas eleitorais erraram? Diante do questionamento, veículos de imprensa e responsáveis por levantamentos de intenção de voto respondiam que não, as pesquisas não erraram. A negativa da resposta se baseava em diversos argumentos. Um era o de…

View On WordPress

#Amostragem #Análise Política #Conjuntura Política #Eleição Presidencial #Eleições #Eleições 2022 #Estatística #Pesquisas Eleitorais #Política Brasileira

Fichamento 03 | Por Émerson Rodrigues

Estatística para Ciências Humanas - Jack Levin

Capítulo 7 - Amostras e populações

Logo no início do capítulo 7, Jack Levin inicia a discussão com os conceitos de População e Amostra, utilizando-se de exemplos comuns como a quantidade de estudantes de uma universidade ou membros de um sindicato X. Ele define então população - ou universo - como sendo um conjunto de indivíduos que possuem, pelo menos, uma característica em comum.

Em virtude de o pesquisador não ter nem tempo nem recursos econômicos suficientes para fazer pesquisas com 100% dos indivíduos de um determinado grupo, ele pôs-se a estudar apenas uma amostra desse grupo, que seria um número menor de sujeitos tirados dessa população. Assim, a partir da amostra, o pesquisador busca tirar conclusões do grupo em que esta amostra foi extraída.

Dito isso, Levin destaca que o processo de amostragem está presente no nosso cotidiano. Aqui, a primeira ideia que vem a minha cabeça são as pesquisas eleitorais, encomendadas, em sua maioria, por jornais e institutos ligados ao mercado de ações. No dia do primeiro e segundo turnos das eleições, tais sondagens podem até não ser tão exatas, no entanto, não restam dúvidas de que elas trazem um importante parâmetro para os eleitores situarem seus candidatos dentro da corrida eleitoral, algo que tem tanto aspectos positivos quanto negativos.

Assista ao vídeo abaixo e entenda um pouco mais sobre os conceitos de população e amostra:

Métodos de Amostragem

Neste tópico, Jack Levin ressalta que o pesquisador que trabalha com amostras utiliza técnicas mais elaboradas e sistemáticas de amostragem do que as comumente usadas no dia a dia, sempre com a preocupação de saber se sua amostra é bem representativa da população estudada. Assim, se todos os componentes de uma população tiverem igual oportunidade de participar da amostra, diz-se que o método usado é o da amostragem casual. Se não for o caso, fala-se então em amostragem não-casual.

Amostras Não-casuais

Também conhecida como amostragem acidental, esta amostra se baseia com exclusividade no que convém ao pesquisador. Em outras palavras, o pesquisador simplesmente inclui os sujeitos convenientes na amostragem e exclui os inconvenientes.

Um tipo muito comum de amostragem não-casual é a de quotas, segundo Levin, em que diversas características de um população, como idade, sexo e classe social são amostradas nas mesmas proporções em que figuram na população. É esse, inclusive, o tipo de amostra utilizado nas pesquisas de intenções de voto. Assim, se a população brasileira é composta majoritariamente por mulheres, então, na amostra, deve-se ter, obrigatoriamente, mais mulheres do que homens.

Amostras casuais

Já a amostragem casual dá a cada membro da população igual oportunidade de fazer parte da amostra. Para essa amostra dê certo, Levin lembra que todos os sujeitos de uma população devem ser identificados antes da extração da amostra. Um exemplo de uma amostra casual simples é citado pelo autor de Estatística para Ciências Humanas. Quem nunca vendou os olhos para tirar um papel de amigo secreto de um recipiente que atire a primeira pedra.

Esse é o exemplo mais explicativo possível, visto que, ao vendar os olhos, nós temos a possibilidade de selecionar qualquer pessoa participante da brincadeira aleatoriamente. O pesquisador, entretanto, não retira nomes de um chapéu, mas utiliza de uma tábua de números aleatórios para conseguir êxito com sua amostragem.

Confira no vídeo abaixo os tipos de amostragem utilizadas em pesquisas científicas:

Erro amostral

O objetivo de um pesquisador é tentar obter uma amostra que represente uma população na qual ele tem interesse. Dito isso, Jack Levin ressalta que amostras casuais simples dão mais representatividade as características populacionais do que as amostras não-casuais, visto que aquelas dão a todos os membros da população a mesma oportunidade de seleção.

No entanto, é de se esperar sempre alguma diferença entre uma amostra, aleatória ou não, da população da qual ela foi extraída. Esse fator, conhecido como erro amostral, aparece tanto se a pesquisa for bem executada ou não, apesar das boas intenções do pesquisador.

Distribuição Amostral de Médias

Levin inicia esse outro tópico com uma pergunta que muitos alunos devem tê-lo feito ao se deparar com um erro amostral: como é possível generalizar de uma amostra para uma população? Antes de seguir para essas discussões, o autor, porém, afirma que é necessário examinar algumas características de uma distribuição amostral de médias.

São elas: a distribuição amostral de médias aproxima-se da curva normal; a média de uma distribuição de médias amostrais é igual à verdadeira média populacional, ou seja, se calcularmos a média das médias amostrais teremos média igual ao valor da verdadeira média populacional; e o desvio padrão de uma distribuição de médias amostrais é menor do que o desvio padrão da população.

A Distribuição de Médias Amostrais Vista como uma Curva Normal

Diante das explicações, a curva normal então pode ser considerada uma distribuição de probabilidades, indo da probabilidade mais “baixa” até a mais “alta”. Diante disso, podemos dizer que as probabilidades decrescem à medida em que nos distanciamos da média das médias, isto é, da verdadeira média populacional.

Erro padrão da média

Na prática, segundo Levin, o pesquisador raramente faz coleta de dados de mais do que uma ou duas amostras, a partir das quais ele ainda deseja generalizar para a população toda, afinal, “extrair uma distribuição de médias amostrais requer o mesmo esforço que o de estudar individualmente cada membro da população”.

Diante disso, ele não teria como estimar qual o desvio padrão e a média das médias de sua distribuição amostral. Levin destaca, contudo, que o estudioso possui um bom método para estimar o desvio padrão a partir dos dados que lhe fornecem uma única amostra. Tal estimativa é conhecida como erro padrão da média.

“Com a ajuda do erro padrão da média, podemos encontrar o intervalo de valores dentro do qual a verdadeira média populacional pode cair. Podemos, também, estimar a probabilidade com que a nossa média populacional realmente cairá dentro desse mesmo intervalo (de valores de médias). Este é o conceito de intervalo de confiança”.

Intervalos de confiança

Na tomada de decisões estatísticas nunca há possibilidade de ter certeza absoluta. O uso do intervalo de 95%, por exemplo, quer dizer que há 95 possibilidades em 100 de estar-se correto. No entanto, devemos sempre ter em mente que a média amostral do pesquisador poderia ser uma daquelas 5 possibilidades em 100 que caíram fora do intervalo estabelecido.

Uma coisa importante de se dizer é que, quando aumentamos o intervalo de confiança de uma amostra, mais é difícil estimar a verdadeira média populacional. Por isso, o estudioso deve escolher entre estar correto com maior precisão ou estar correto com maior confiança.

Estimativa de proporções

Não raro o pesquisador procura obter uma estimativa duma proporção populacional a partir de outra proporção resultante do estudo de uma amostra casual. O maior exemplo disso são as pesquisas de intenções de voto, feitas antes das eleições. Quando um pesquisador anuncia que 45% dos brasileiros votarão em Fernando Haddad (PT), no entanto, ele reitera com convicção de que não está 100% correto. Em geral, as pesquisas de intenções de voto no Brasil, por exemplo, tem de 95% de intervalo de confiança.

Referências

LEVIN, Jack. Estatística para Ciências Humanas. 2004.

#população #amostragem #estatísticaecomunicação #intervalodeconfiança #amostracasual #amostranãocasual

Amostragem

Podemos usar observações de elementos aleatórios de uma população para fazer inferências sobre essa população. Os elementos aleatórios retirados da população são a amostra. As técnicas utilizadas para obter esses elementos aleatórios constituem a amostragem.

Quando se pretende realizar um estudo de investigação científica, é necessário definir os critérios de inclusão no estudo – quem pode ser incluído no estudo, ou seja, quem vai fazer parte da população –, qual será a dimensão da amostra e como se vai obter a amostra. A técnica que vai ser utilizada para obter a amostra é a amostragem.

As amostragens não probabilísticas (ex. amostras de conveniência) não servem para fazer inferências sobre a população porque não temos como saber quem e que características tinham as pessoas que não tiveram oportunidade de fazer parte da amostra. Como não são representativas da população, normalmente dão resultados enviesados.

É muito importante que a amostra seja constituída por elementos da população, obtidos aleatoriamente. Se a amostra não for aleatória, corremos o risco de obter resultados enviesados e limites de confiança incorrectos.

O que é uma amostra aleatória? É uma amostra constituída por elementos da população que se pretende estudar, na condição de que esses elementos não tenham sido seleccionados pelo investigador.

Deve ser previamente assegurado que todos os elementos da população têm a mesma probabilidade de serem seleccionados para fazerem parte da amostra. Se se cumprirem estes requisitos, obteremos uma amostragem probabilística.

Até mesmo as amostras probabilísticas, apenas pelo facto de serem probabilísticas, não garantem resultados não enviesados (ex. se houver grande percentagem de não respostas ou amostras de pequena dimensão).

As amostras probabilísticas de grande dimensão produzem estimativas mais precisas sobre os parâmetros da população.

Técnicas de amostragem probabilística: amostragem aleatória simples; amostragem estratificada e amostragem múlti-estádios.

Amostragem aleatória simples

Obtêm-se amostras aleatórias simples por dois processos: amostra aleatória se a dimensão da população permitir numerar todos os seus elementos e fazer-lhe corresponder números gerados aleatoriamente; amostra aleatória sistemática quando a dimensão da população é tão grande que este processo de torna difícil de executar e amostra consecutiva quando não se elaborar uma lista com todos os elementos da população.

Amostra aleatória. Definida a população e a dimensão da amostra, elabora-se uma lista com todos os elementos da opulação e atribui-se um número a cada um dos elementos dessa lista. Depois, gera-se a quantidade de números aleatórios correspondente à dimensão da amostra. Seleccionam-se os elementos da lista que tenham o número correspondente. Fica assim definida a amostra.

Amostra aleatória sistemática. Definida a população e a dimensão da amostra, elabora-se uma lista com todos os elementos da população. Imaginemos que há 15000 indivíduos na população que se pretende estudar e que pretendemos obter uma amostra de 500 indivíduos. A fracção da amostra é 500/150000 = 1/300. Obtemos um número ao acaso entre 1 e 300. Suponhamos que foi o número 156. Seleccionaríamos então o 156º elemento da lista e depois em cada 300, isto é, o 456º, 0 756º e assim por diante, até se obterem os 300 elementos que constituirão a amostra.

Amostra consecutiva: Em investigação clínica, por vezes não é possível elaborar uma lista com todos os elementos a estudar (ex. população de todos os doentes com determinada condição clínica). Neste caso, basta haver um critério de inclusão no estudo, bem definido. A amostra poderá ser todos os doentes que se apresentem, consecutivamente, desde que cumpram os critérios de inclusão. A amostra será aleatória e probabilística porque o investigador não interfere na escolha dos elementos e todos os elementos têm igual probabilidade de serem seleccionados para a amostra. Esta amostra é obtida por um processo idêntico ao utilizado na amostra aleatória sistemática, com a diferença de fracção da amostra é de 1/1.

Amostragem estratificada

Estratifica-se a amostra quando se sabe que o atributo que se quer estudar é heterogéneo na população. Exemplo: pretende-se saber qual é a altura média dos trabalhadores de uma empresa. A população em estudo são todos os trabalhadores da empresa. Sabe-se que a média das alturas dos homens é superior à média das alturas das mulheres. Neste caso, sabe-se também que os homens representam 2/3 dos trabalhadores e as mulheres 1/3. Obtêm-se amostras aleatórias separadas (uma amostra de homens e uma amostra de mulheres) da mesma dimensão e obtêm-se estimativas das médias, separadas. Depois, combinam-se as estimativas dando a cada estimativa uma ponderação proporcional à sua contribuição para a média global. A média global seria dada pela média das alturas dos homens multiplicada por 2/3 mais a média das alturas das mulheres multiplicada po 1/3, dando uma estimativa da média populacional.

Amostragem múlti-estádios

Quando a população não pode ser enumerada, utiliza-se a amostragem múlti-estágios. Este tipo de amostragem inclui ainda a amostragem em clusters.

Amostragem múlti-estádios. Exemplo: a população a estudar são os doentes em programas de hemodiálise nos hospitais públicos de Portugal. Pode-se dividir o país em regiões e seleccionar algumas aleatoriamente (ex. 5 regiões). Elabora-se uma lista dos hospitais de cada região seleccionada e seleccionam-se alguns aleatoriamente (ex. 5 hospitais). Elabora-se uma lista dos doentes em programas de hemodiálise de cada hospital seleccionado e seleccionam-se alguns aleatoriamente (ex. 20 doentes). Isto seria uma amostra aleatória de 500 doentes em 3 estádios.

Amostragem em clusters. Variante da amostragem multi-estádios em que a população é dividida em estádios /secções / clusters, são seleccionados aleatoriamente alguns desses clusters e a amostra são todos os elementos do último estádio /secção / cluster. Exemplo: a população a estudar são os doentes em programas de hemodiálise nos hospitais públicos de Portugal. Pode-se dividir o país em regiões e seleccionar algumas aleatoriamente. Elabora-se uma lista dos hospitais de cada região seleccionada e seleccionam-se alguns aleatoriamente. A amostra serão todos os doentes em programa de hemodiálise nos hospitais seleccionados.

Fonte: A. Gouveia de Oliveira. Bioestatística, Epidemiologia e Investigação – teoria e aplicações. Lidel – edições técnicas Lda., 2009. ISBN: 978-972-757-558-9.

#amostra epidemiologia Investigação #amostragem #amostra aleatória