Alunos do PCS são premiados em conferência internacional
Estudo apresenta uma estratégia baseada na gestão da proveniência dos dados para buscar o aumento do reuso de dados gerados em pesquisas.
Os alunos de doutorado Daniel Lins da Silva e André Batista, orientados pelo Prof. Dr. Pedro Luiz Pizzigatti Corrêa, foram premiados pelo trabalho “Data Provenance in Environmental Monitoring” (Proveniência de Dados no Monitoramento Ambiental). O reconhecimento como melhor artigo veio no 1st International Workshop on Data Science for Internet of Things, do 13th IEEE International Conference on Mobile Ad Hoc and Sensor Systems 2016.
Segundo os pesquisadores, no contexto científico atual, ainda existe uma grande dificuldade na reutilização do conhecimento produzido pelas pesquisas. Explica Daniel: “Nos últimos dez anos, devido os avanços tecnológicos, estamos presenciando a geração de um volume cada vez maior de dados — o chamado ‘dilúvio dos dados’. Em consequência, os métodos para a manipulação destes dados também se tornaram bastante complexos. Dificultando ainda mais a sua descoberta, análise e reuso por outros pesquisadores. ” Ele comenta que a antiga dificuldade da ausência de dados foi substituída pelo desafio de gerenciar sua abundância.
É a partir dessa problemática que surge a pesquisa premiada. Para possibilitar uma melhor reutilização dos dados científicos produzidos, o estudo propõe uma estratégia baseada em uma arquitetura computacional para gestão da proveniência dos experimentos científicos. André explica que a proveniência representa o registro de todos os passos para a criação ou manipulação de um conjunto de dados.
Daniel explica a importância de se conhecer a origem dos dados e os dados na sua versão original, chamados de dados brutos. No entanto, ele pontua que até a publicação de um estudo, estes dados brutos passam por diversas etapas e processamentos. Por isso, a reutilização dos dados publicados muitas vezes é evitada, devido a ausência de informações suficientes sobre os métodos ou pesquisadores que geraram estes dados. E é nesse ponto que a gestão da proveniência dos dados é considerada. André explica que a proveniência disciplina o processo de manipulação dos dados e permite ao pesquisador registrar o que foi feito. “Com a proveniência, avalia-se as diversas versões de um dado e os processos pelo qual ele passou desde sua forma bruta até a versão atual, possibilitando que outros pesquisadores possam avaliar e reutilizar o dado com confiança.”, diz Daniel.
Entretanto, não se trata apenas de otimizar o processo científico e a evolução da ciência, mas também a economia de recursos financeiros. “Se um grupo [de pesquisa] não tiver informações suficientes para garantir que um dado [já publicado por outro grupo] é de qualidade e confiável, ele irá preferir gastar tempo e recursos adicionais para gerar o mesmo dado existente, mas com a certeza de que este dado é adequado para a sua pesquisa. Na dúvida, o pesquisador prefere coletar ou gerar o dado novamente. E isso é bastante comum hoje em dia”, afirma Daniel. “A partir do momento que se aumenta o reuso dos dados, evitamos que múltiplos recursos sejam gastos para se gerar um mesmo dado.”, diz.
Sobre a premiação, André considera que o trabalho antecipou uma problemática que os pesquisadores de Internet das Coisas logo vão enfrentar e, além disso, apresentou uma estratégia para lidar com ela. “Enquanto a maioria dos artigos do evento se preocupavam com a geração e coleta dos dados, o nosso trazia uma problemática diferente, da gestão dos dados. Falamos em como tratar os dados coletados e como garantir que os mesmos possam ser reutilizados. Então acreditamos que esse foi o diferencial para eles premiarem o trabalho. ”
A respeito da recepção do artigo, André explica que, devido os pesquisadores do evento trabalharem com a coleta e manipulação dos dados, foi possível apresentar a pesquisa para pessoas que lidam diariamente com esta problemática. “Pessoas que fazem as pesquisas na ponta, com os dados”, diz. Dessa forma, ele considera que o prêmio significa que “estamos tratando, de fato, de uma preocupação relevante na área de ciência dos dados”, afirma o pesquisador.
Questionado sobre os próximos passos da pesquisa, Daniel revela que um artigo será escrito para a revista internacional Ecological Informatics. Nessa publicação, a evolução da estratégia proposta será aplicada à modelagem e distribuição de espécies. “Esperamos que outros avanços também sejam publicados em 2017”, diz.
Perguntado sobre a importância do prêmio, Daniel afirma que os pesquisadores estão se preocupando, cada vez mais, com a manutenção e a reutilização do conhecimento gerado em suas pesquisas, garantindo benefícios para a comunidade científica, para os financiadores e para a sociedade. No entanto, a falta de ferramentas e boas práticas que auxiliem este processo são evidentes. “O reconhecimento desta pesquisa é importante para nosso grupo de pesquisa, pois buscamos realizar estudos relevantes, que gerem resultados práticos tanto para a comunidade científica quanto para a sociedade.”, afirma o pesquisador.
Lázaro Campos Júnior | Jornalismo Júnior