Plataforma agiliza acesso a informações detalhadas dos censos demográficos

Registros por pessoa e domicílio entrevistados nos Censos de 1960 a 2010 estão disponíveis na internet

 24/07/2019 - Publicado há 5 anos
Plataforma DataCEM reúne banco de dados com informações por pessoas e domicílios entrevistados dos censos demográficos realizados no Brasil entre os anos de 1960 e 2010, que podem ser consultados e comparados pelos usuários na internet – Imagem: Reprodução / Site do CEM

.
O Centro de Estudos da Metrópole (CEM) acaba de lançar uma plataforma que disponibiliza na internet os microdados dos censos demográficos realizados pelo Instituto Brasileiro de Geografia e Estatística (IBGE) entre 1960 e 2010. A plataforma DataCEM permite aos pesquisadores produzirem suas próprias tabelas com base nos microdados, que são os registros de cada uma das pessoas e domicílios entrevistados no censo, reduzindo os custos no tratamento dos dados. O CEM, um dos Centros de Pesquisa, Inovação e Difusão (Cepids) da Fundação de Amparo à Pesquisa do Estado de São Paulo (Fapesp), é sediado na USP e no Centro Brasileiro de Análise e Planejamento (Cebrap).

Microdados são bancos de dados que contêm o maior detalhamento possível das informações coletadas. No caso do censo, são os registros de todas as pessoas e domicílios entrevistados. Os microdados podem ser agregados para obter informações sobre unidades maiores, conforme desejado pelo usuário: distritos, municípios, microrregiões, mesorregiões, unidades da federação, etc. A plataforma contém ainda não apenas as variáveis originais, como também versões harmonizadas e padronizadas que permitem maximizar as comparações dentro da série histórica.

O desenvolvimento do DataCEM foi coordenado pelo pesquisador do CEM Rogério Barbosa. “Na plataforma, é possível fazer a consulta e extração de microdados dos censos”, destaca. “Temos bancos de dados com as informações individuais, mas com anonimato e sigilo garantidos, sem nenhum tipo de identificador”, garante. A plataforma DataCEM tem como público-alvo os pesquisadores, em especial aqueles que procuram estudar e compreender os processos socioeconômicos, políticos e demográficos no Brasil. O DataCEM pode ser acessado neste link.

Divulgação de dados

A primeira novidade trazida pelo DataCEM é a divulgação das edições mais antigas dos censos, de 1960 a 1991 – o portal do IBGE só disponibiliza microdados dos dois censos mais recentes. A amostra do censo de 1960, a mais rara, passou por extenso processo de revisão e consistência. Além disso, o IBGE distribui as informações em um formato extremamente técnico, que pode ser de difícil compreensão e acesso para pesquisadores, especialmente os que não são muito experientes com dados quantitativos.

“No DataCEM, já fizemos um pré-processamento dos dados do censo e podemos disponibilizar apenas as variáveis que os pesquisadores precisam”, conta Barbosa. O DataCEM também ajuda o usuário no uso de recurso computacional, já que o arquivo contendo um censo pode ter 20 gigabytes de tamanho. Softwares estatísticos geralmente abrem um arquivo inteiro do censo demográfico, que será armazenado na memória do computador do usuário.

A plataforma conta também com o WikiDados, um repositório de informações para consulta e textos explicativos. “É como uma pequena Wikipedia, uma enciclopédia sobre o DataCEM”, destaca o pesquisador. Há um glossário de conceitos essenciais utilizados pelo IBGE no censo, artigos e resumos sobre várias áreas, falando sobre as possibilidades de harmonização, chegando até a orientações para os pesquisadores sobre como adaptar os dados para finalidades específicas.

.

DataCEM  possui glossário de conceitos utilizados na elaboração do censo, artigos e resumos mostrando possibilidades de combinação dos dados e orientações para realização de consultas à plataforma – Imagem: Reprodução / Site do CEM

.

Transferência de conhecimento

+ Mais

Estado tende a expandir vagas em creches por meio do Terceiro Setor

Brasil ainda não atingiu cenário de igualdade

Criação de políticas públicas depende de subsídios e experiência

Brasil reduziu desigualdades entre 1960 e 2010

O DataCEM nasceu do esforço de uma equipe de seis pessoas, coordenadas por Barbosa, que tinham como responsabilidade levantar e tratar dados que seriam utilizados pelos pesquisadores que estavam trabalhando nos capítulos do livro Trajetórias das Desigualdades: Como o Brasil Mudou nos Últimos 50 Anos, publicação do CEM organizada pela cientista política Marta Arretche, diretora do Centro. Nessa etapa de produção do livro, o trabalho desse grupo foi chamado de Projeto Censo.

Para esse levantamento de dados, foram produzidos modelos estatísticos e tabelas, que precisavam ter os mesmos recortes e definições, e que fossem sempre comparáveis. Um exemplo pode ser retirado no tema sobre trabalho. Nos Censos de 1960 e 1970, uma pessoa que realizasse trabalho voluntário por menos de 15 horas semanais não era considerada como “ocupada”, mas sim como não economicamente ativa. Já os Censos de 1980 em diante incluem essas pessoas como ocupadas. “São pequenas variações desse tipo que fazem com que uma série de dados não seja consistente. O que nossa equipe fez foi identificar essas situações e fazer uma padronização, uma harmonização”, lembra o pesquisador.

Depois da publicação do livro, o CEM passou a contar com uma ampla base de dados que era usada, até então, apenas pelos próprios pesquisadores. “Então veio a ideia de disponibilizar para o público externo esse trabalho, de forma que pesquisadores externos ao CEM não precisassem fazer esse trabalho de novo. Foi uma forma de transferir o conhecimento produzido pelo Centro para a sociedade”, ressalta Barbosa. “Com o DataCEM, os custos de entrada no uso dos Censos Demográficos são reduzidos. Se todos os pesquisadores precisarem fazer sua harmonização, podem demorar muito e despender muita energia.”

Da Assessoria de Comunicação do CEM

Mais informações: e-mail centrodametropole@usp.br, no Centro de Estudos da Metrópole


Política de uso 
A reprodução de matérias e fotografias é livre mediante a citação do Jornal da USP e do autor. No caso dos arquivos de áudio, deverão constar dos créditos a Rádio USP e, em sendo explicitados, os autores. Para uso de arquivos de vídeo, esses créditos deverão mencionar a TV USP e, caso estejam explicitados, os autores. Fotos devem ser creditadas como USP Imagens e o nome do fotógrafo.