Trabalho premiado propõe estratégia para verificar dados científicos

Artigo sobre proveniência de dados propõe a gestão e o reuso de informações para maior eficiência em pesquisas

 30/01/2017 - Publicado há 7 anos
Daniel da Silva é um dos autores reconhecidos pelo artigo no 13th IEEE - Foto: Divulgação PCS
Daniel da Silva é um dos autores reconhecidos pelo artigo no 13th IEEE – Foto: Divulgação PCS

.
Os alunos de doutorado Daniel da Silva e André Batista, orientados pelo Pedro Luiz Corrêa, do Departamento de Engenharia de Computação e Sistemas Digitais (PCS) da Escola Politécnica (Poli) da USP, foram premiados pelo trabalho Data Provenance in Environmental Monitoring (Proveniência de Dados no Monitoramento Ambiental). O reconhecimento como melhor artigo veio no primeiro Workshop Internacional sobre Ciência dos Dados para Internet das Coisas, do 13th IEEE International Conference on Mobile Ad Hoc and Sensor Systems 2016.

Segundo os pesquisadores, o contexto científico atual é de dificuldade em reutilizar e reproduzir o conhecimento produzido. Explica Daniel da Silva: “Nos últimos dez anos, com os avanços tecnológicos, houve geração de grande volume de dados — o chamado ‘dilúvio dos dados’.” Ele diz que a questão não é mais falta de dados, mas a abundância desses, o que traz a necessidade de saber como trabalhar com esses dados em grande quantidade.

É a partir dessa problemática que surge a pesquisa premiada. Para gerir a quantidade de dados científicos produzidos, o estudo propõe uma estratégia, uma Trabalho premiado propõe estratégia para verificar dados científicos para controle da proveniência dos experimentos científicos. André Batista explica que a proveniência se trata do registro de todos os passos para criação ou manipulação de um conjunto de dados.

Da Silva esclarece que é importante saber a fonte dos dados, “o dado bruto”. No entanto, ele pontua que até a publicação de um estudo, este “dado bruto” é manipulado e processado. Dessa maneira, a confiabilidade dessa informação publicada com o objetivo de reutilização fica desgastada, pois não se conhece exatamente o processamento que o dado bruto sofreu. E é nesse ponto que vem a proveniência. Batista explica que ela disciplina o processo de manipulação dos dados e permite ao pesquisador registrar o que foi feito. “Com a proveniência, avalia-se o dado e garante-se que aquele dado tenha confiabilidade e qualidade necessárias para ser reutilizado”, diz Da Silva. Assim, torna-se possível o reuso dos dados já gerados.
.

Trabalho de doutorandos do PCS é reconhecido em evento feito em Brasília - Foto: Divulgação PCS
Trabalho de doutorandos do PCS é reconhecido em evento feito em Brasília – Foto: Divulgação PCS

.
Entretanto, não se trata apenas de agilizar o processo científico e a evolução da ciência, mas também de economia de recursos financeiros. “Se um grupo [de pesquisa] não tiver informações suficientes para garantir que um dado [já publicado] é de qualidade, ele vai preferir gastar mais um ano, mais alguns milhões para gerar o mesmo dado, que já existe, mas com a certeza de que aquele dado é correto. Na dúvida, o pesquisador prefere gerar o dado novamente.
E isso é o que mais acontece hoje”, afirma Da Silva. “A partir do momento que se aumenta o reuso de um dado, evita-se que sejam gastos mais recursos para gerar novamente um dado que já existe”, diz.

Sobre a premiação, Batista considera que o trabalho antecipou uma problemática que os pesquisadores de ciência dos dados em internet das coisas logo vão enfrentar e, além disso, propuseram uma estratégia para lidar com ela. “Enquanto a maioria dos artigos se preocupavam com a geração e coleta dos dados, o nosso trazia a problemática diferente, da gestão dos dados. Falamos em como se trata os dados coletados e sobre o planejamento da coleta desses dados. Então acreditamos que esse foi o diferencial para eles premiarem o trabalho.”

A respeito da recepção do artigo, Batista explica que, enquanto eles trabalham com a manipulação dos dados, puderam apresentar o trabalho para pessoas que lidam com a problemática da coleta dos dados. “Pessoas que fazem as pesquisas na ponta, de fato, com os dados”, diz. Dessa forma, ele considera que o prêmio significa que “estamos tratando, de fato, de uma preocupação da área deles”, afirma o pesquisador.

Questionado sobre os próximos passos de pesquisa, Da Silva revela que um artigo será escrito para revista internacional Ecological Informatics. Nessa publicação, a evolução da proposta de proveniência será aplicada à modelagem e distribuição de espécies. “Esperamos que vários outros artigos surjam em 2017”, diz.

Perguntado sobre a importância do prêmio, Da Silva afirma que isso mostra que a pesquisa tem relevância, que eles, pesquisadores, estão no caminho certo. “É importante porque aqui [no departamento] se buscam estudos com relevância que gerem resultados práticos tanto para a sociedade quanto para as diversas áreas de pesquisa”, afirma o pesquisador.

Lázaro Campos Júnior / Jornalismo Júnior


Política de uso 
A reprodução de matérias e fotografias é livre mediante a citação do Jornal da USP e do autor. No caso dos arquivos de áudio, deverão constar dos créditos a Rádio USP e, em sendo explicitados, os autores. Para uso de arquivos de vídeo, esses créditos deverão mencionar a TV USP e, caso estejam explicitados, os autores. Fotos devem ser creditadas como USP Imagens e o nome do fotógrafo.