Descrição:

A busca bibliográfica na literatura científica é uma tarefa que faz parte da vida de todos os pesquisadores. Grande parte dela é feita por meio de ferramentas de busca na internet. As vantagens desse meio são diversas, onde se destacam a velocidade em que as buscas são realizadas, o número de conteúdos analisados e a qualidade dos resultados. Mesmo com todas essas vantagens e a diversidade de ferramentas que executam essa tarefa com eficiência, ainda é comum ouvir reclamações de certas limitações desses sistemas de busca.

Tendo essas limitações como motivação, esse trabalho teve como objetivo propor algumas soluções que pudessem facilitar as atividades de busca dos pesquisadores. Além disso, criou-se uma ferramenta para que pudesse ser testada a eficácia dessas soluções. As soluções foram: indexação do conteúdo de um artigo no formato PDF a partir de um arquivo de template e busca por artigos relacionados a um documento de artigo enviado. Também foram implementados formas de buscas convencionais.

Na ferramenta não são indexados apenas artigos, também são armazenados os autores, instituições e palavras-chaves. Todos esses elementos são passivos de buscas e se relacionam entre si na ferramenta.

Na elaboração da ferramenta verificou-se a possibilidade de fazer um tratamento semelhante ao realizado com páginas web sobre os artigos científicos. O mapeamento entre os elementos de um artigo e uma página web pode ser visualizado a seguir:

O sistema construido, em sua grande parte, valeu-se de desse ajuste dos conceitos empregados em ferramentas de busca por páginas web sobre artigos cientíificos. A arquitetura do sistema e o algoritmo de ordenação dos conteúdos do Banco de Dados foram alguns dos elementos que mais se valeram dessa adaptação.

Uma das maiores diferenças encontradas nas adaptações feitas foi com relação ao formato de documento utilizado pelos artigos, o PDF (Portable Document Format). Onde a sua estrutura é mais complexa que os documentos no formato HTML (HyperText Markup Language) utilizados pelas páginas Web. Para o acesso do conteúdo desses documentos foi necessário construir um módulo que extrai as informações dos PDFs a partir de um template de artigo.

Participantes:

Luis Arthur Bighetti Vallini

Orientador:

Prof. Dr. João José Neto