Indexação e recuperação de teses e dissertações por meio de sintagmas nominais

Renato Fernandes Corrêa, Darliane Goes de Miranda, Camila Oliveira de Almeida Lima, Tiago José da Silva

Resumo


Introdução. Aborda a utilização dos sintagmas nominais no processo indexação automática das teses e dissertações depositadas na Biblioteca Digital de Teses e Dissertações da UFPE (BDTD-UFPE), considerando a hipótese de que os sintagmas nominais consistiriam numa melhor unidade de conhecimento para a indexação e recuperação de informação que as palavras isoladas, permitindo aumentar a satisfação da necessidade de informação do usuário durante a busca pela informação. Discute-se sobre o estado da arte dos sintagmas nominais e de sua extração automática, bem como sua aplicação na indexação automática e recuperação de informação. Método. Analisa, com base em ferramenta para análise de texto (OGMA), a aplicabilidade da extração de sintagmas nominais na indexação automática e recuperação de informação de teses e dissertações no contexto da BDTD-UFPE. Com base em resumos da área de Direito, Computação e Nutrição, definiram-se os valores totais para cada uma das variáveis observadas, o que permitiu avaliar a extração de sintagmas nominais através dos percentuais de precisão de sintagmas nominais relevantes; da taxa de erro ao extrair cadeias de caracteres que não constituem sintagmas nominais, e; do percentual de sintagmas nominais extraídos não relevantes. Resultados. O processo de extração de sintagmas nominais através do OGMA teve diferentes desempenhos para cada programa de pós-graduação, sendo obtido melhor desempenho (melhor índice de precisão) para resumos de Direito, seguidos dos de Computação e Nutrição. Esta diferença de desempenho pode em parte ser explicada pela diferente natureza dos termos técnicos presentes nos resumos. Conclusões. Embora existam limitações nas ferramentas disponíveis, a aplicação de métodos automatizados de extração e indexação por sintagmas nominais mostra-se promissora, pois os sintagmas nominais se configuram como melhores descritores e pontos de acesso aos documentos, eliminando os problemas causados pela sinonímia e a polissemia das palavras isoladas.

Palavras-chave


Sintagmas nominais; Recuperação de informação; Indexação automática; Teses e dissertações

Texto completo:

HTML PDF EPUB

Referências


BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern information retrieval. New York: ACM Press, 1999.

KURAMOTO, H. Sintagmas nominais: uma nova proposta para a recuperação de informação. DataGramaZero: revista de Ciência da Informação, v. 3, n. 1, 2002.

______. Uma abordagem alternativa para o tratamento e a recuperação de informação textual: os sintagmas nominais. Ciência da Informação, Brasília, v. 25, n. 2, 1995.

LE GUERN, M. Un analyseur morpho-syntaxique pour l’indexation automatique. Le Français Moderne, v. 59, n. 1, p. 22-35, juin 1991.

MAIA, L. C. G. Uso de sintagmas nominais na classificação automática de documentos eletrônicos. 2008. Tese (Doutorado em Ciência da Informação) – Universidade Federal de Minas Gerais – UFMG. Belo Horizonte, 2008.

MIORELLI, S. T. Extração do sintagma nominal em sentenças em português. 2001. 98 f. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Informática, Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre.

PERINI, M. A. Gramática descritiva do português. 3 ed. São Paulo: Ática, 1998.

SOUZA, R. R.; ALVARENGA NETO, R. C. D. de; MENDES, K. C. I. Mapeamento semântico através da análise de ocorrência de descritores sobre gestão do conhecimento. Transinformação, v. 19, n. 1, p. 19-30, 2007.

SOUZA, R. R. Uma proposta de metodologia para indexação automática utilizando sintagmas nominais. Encontros Bibli: revista eletrônica de Biblioteconomia e Ciência da Informação, v. 11, n. esp., p. 42-59, 2006.

TUFANO, D. Estudos de língua e literatura. 4. ed. São Paulo, Moderna, 1990.




DOI: http://dx.doi.org/10.5380/atoz.v1i1.41280

Apontamentos

  • Não há apontamentos.




Universidade Federal do Paraná
Mestrado e Doutorado Interdisciplinar em Gestão da Informação
ISSN: 2237-826X
Qualis (2013-2016):
B2 - Comunicação e Informação
B4 - Planejamento Urbano e Regional/Demografia; Saúde Coletiva; Interdisciplinar
B5 - Arquitetura, Urbanismo e Design; Engenharias III
Licença Creative Commons
Esta obra foi licenciada sob uma Licença
Creative Commons Atribuição-NãoComercial-CompartilhaIgual 3.0 Não Adaptada