Portal ENSP - Escola Nacional de Saúde Pública Sergio Arouca Portal FIOCRUZ - Fundação Oswaldo Cruz

Pesquisa sobre Condições de Saúde Bucal da População Brasileira - SBBrasil 2003

Disseminação do arquivos de dados com os pesos amostrais

Conforme documentado no arquivo de Queiroz et al, 2009 (baixe aqui), a Pesquisa sobre Condições de Saúde Bucal da População Brasileira 2003 utilizou uma amostra complexa, estratificada por municípios de capital, macrorregiões do Brasil e classes de porte populacional dos municípios (exceto os de capital), que foi selecionada a partir de dois cadastros distintos: 1) setores censitários; e 2) creches e escolas.

No artigo de Queiroz et al, 2012 (baixe aqui), os autores descrevem os métodos que utilizaram para calcular e calibrar os pesos amostrais da pesquisa, bem como formas para obter estimativas de parâmetros populacionais e de erro amostral, variâncias, erros-padrão e testes de significância estatística em modelos, dentre outros.

Para obter as estimativas pontuais de parâmetros populacionais, basta utilizar um sistema estatístico que admita ponderação dos resultados, usando a variável de peso amostral calibrado (peso_cal, nos arquivos gerados).

No entanto, para obter estimativas de variâncias e demais medidas delas dependentes, alguns aspectos adicionais devem ser considerados, visto que os dados são provenientes de uma amostra complexa cujos pesos amostrais foram calibrados. Em decorrência, duas fontes adicionais de variabilidade devem ser consideradas para obter essas estimativas: a fonte decorrente do uso de uma amostra complexa; e a fonte derivada dos resíduos de calibração dos pesos amostrais.

No primeiro caso, deve-se usar o método do conglomerado primário (com linearização de Taylor) considerando todas as informações estruturais do desenho da amostra, ou seja: estrato de seleção (variável ESTR_AGR), unidade primária de amostragem (variável UPA_AGR) e o peso amostral (variável peso_cal).

Para considerar as duas fontes de variabilidade nas estimativas, existe atualmente a biblioteca Survey do R, desenvolvida por Thomas Lumley, que, além da documentação usual das bibliotecas do R, escreveu um livro bastante didático sobre o assunto. Os arquivos para uso no R são um objeto de calibração da biblioteca Survey (no arquivo "SBBrasil2003.rda"), que contém o desenho da amostra, suas variáveis estruturais e os resíduos de calibração. Além desses, traz todas as variáveis da pesquisa disponibilizadas pelo MS, um programa para carregar esse objeto já com as opções adequadas (arquivo "Rotina para carregar o objeto.r") e um arquivo com a documentação das variáveis. Para baixar esses arquivos, clique aqui.

Duas outras opções foram produzidas para uso nos sistemas SAS e SPSS. De fato, a opção por qualquer desses sistemas não conduzirá a estimativas tão acuradas das medidas de variabilidade, mas serão, sem dúvida, melhores que as até então usadas (estatísticas amostrais, não ponderadas).

Para o uso no SAS, as estimativas devem ser produzidas nos procedimentos SURVEYFREQ, SURVEYLOGISTIC, SURVEYMEANS, SURVEYPHREG, e SURVEYREG, sempre com a opção VARMETHOD=TAYLOR e com os comandos "CLUSTER = UPA_AGR;", "STRATA = ESTR_AGR;" e "WEIGHT = peso_cal;". Os arquivos incluídos na versão SAS são dois: dados ("SBBrasil2003.sas7bdat") e documentação. Para baixá-los, clique aqui.

Para o uso no SPSS, as estimativas devem ser produzidas no módulo Complex Samples (menu Analyse, Complex Samples) usando o arquivo de plano de amostra complexa "SBBrasil2003.csaplan", já incluído no conjunto de arquivos fornecidos. Além desse arquivo, há o arquivo de dados ("SBBrasil2003.sav") e o de documentação. Para baixá-los, clique aqui.

1 Lumley Thomas. Complex Surveys; A Guide to Analysis Using R. New York: John Wiley & Sons, 2010.

ESCOLA NACIONAL DE SAÚDE PÚBLICA SERGIO AROUCA
Rua Leopoldo Bulhões, 1480 - Manguinhos, Rio de Janeiro - CEP: 21041-210 - Tel.: (21) 2598-2925 / 2453

Valid XHTML 1.0 Transitional CSS válido!