Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales

Autores/as

  • Renato Fernandes Corrêa Universidade Federal de Pernambuco - UFPE
  • Darliane Goes de Miranda Universidade Federal de Pernambuco - UFPE
  • Camila Oliveira de Almeida Lima Universidade Federal de Pernambuco - UFPE
  • Tiago José da Silva Universidade Federal de Pernambuco - UFPE

DOI:

https://doi.org/10.5380/atoz.v1i1.41280

Palabras clave:

sintagmas nominales, recuperación de información, indización automática, tesis y disertaciones

Resumen

Introducción: Aborda la utilización de los sintagmas nominales en el proceso de indización automática de las tesis y las disertaciones depositadas en la Biblioteca Digital de Tesis y Disertaciones de UFPE (BDTD-UFPE), considerando la hipótesis de que los sintagmas nominales consistirían en una mejor unidad de conocimiento para la indización y recuperación de información, que términos aislados, permitiendo aumentar la satisfacción de las necesidades de información del usuario durante la búsqueda de información. Se discute sobre el estado del arte de los sintagmas nominales y de su extracción automática, tanto como de su aplicación en la indización automática y en la recuperación de información. Metodología: Tomando como base la herramienta para análisis de texto (OGMA), analiza la aplicación de la extracción de sintagmas nominales en la indización automática y recuperación de información de las tesis y disertaciones en el contexto de BDTD-UFPE. Con base en los resúmenes en el área de Derecho, Computación y Nutrición, se definieron los valores totales para cada una de las variables observadas, lo que permitió evaluar la extracción de sintagmas nominales a través de los porcentajes de precisión de los sintagmas nominales relevantes; la tasa de error al extraer las cadenas de caracteres que no constituyen sintagmas nominales, y, el porcentaje de sintagmas nominales extraídos que no son relevantes. Resultados: El proceso de extracción de sintagmas nominales a través de OGMA tiene diferentes desarrollos para cada programa de posgrado, habiéndose obtenido un mejor desarrollo (mejor índice de precisión) para los resúmenes de Derecho, seguidos por los de Computación y los de Nutrición. Esta diferencia en el desarrollo puede explicarse en parte por la naturaleza diferente de los términos técnicos presentes en los resúmenes. Conclusión: Aunque existan limitaciones en las herramientas disponibles, la aplicación de métodos automatizados de extracción e indización por medio de sintagmas nominales es prometedora, ya que los sintagmas nominales se configuran como mejores descriptores y puntos de acceso a los documentos, eliminando los problemas causados por la sinonimia y la polisemia de las palabras aisladas.

Biografía del autor/a

Renato Fernandes Corrêa, Universidade Federal de Pernambuco - UFPE

Bacharel em Informática - UFV, Doutor em Ciência da Computação - UFPE. Professor adjunto - UFPE/DCI

Darliane Goes de Miranda, Universidade Federal de Pernambuco - UFPE

Graduanda em Gestão da Informação - UFPE

Camila Oliveira de Almeida Lima, Universidade Federal de Pernambuco - UFPE

Graduanda em Gestão da Informação - UFPE

Tiago José da Silva, Universidade Federal de Pernambuco - UFPE

Graduando em Gestão da Informação - UFPE

Citas

BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern information retrieval. New York: ACM Press, 1999.

KURAMOTO, H. Sintagmas nominais: uma nova proposta para a recuperação de informação. DataGramaZero: revista de Ciência da Informação, v. 3, n. 1, 2002.

______. Uma abordagem alternativa para o tratamento e a recuperação de informação textual: os sintagmas nominais. Ciência da Informação, Brasília, v. 25, n. 2, 1995.

LE GUERN, M. Un analyseur morpho-syntaxique pour l’indexation automatique. Le Français Moderne, v. 59, n. 1, p. 22-35, juin 1991.

MAIA, L. C. G. Uso de sintagmas nominais na classificação automática de documentos eletrônicos. 2008. Tese (Doutorado em Ciência da Informação) – Universidade Federal de Minas Gerais – UFMG. Belo Horizonte, 2008.

MIORELLI, S. T. Extração do sintagma nominal em sentenças em português. 2001. 98 f. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Informática, Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre.

PERINI, M. A. Gramática descritiva do português. 3 ed. São Paulo: Ática, 1998.

SOUZA, R. R.; ALVARENGA NETO, R. C. D. de; MENDES, K. C. I. Mapeamento semântico através da análise de ocorrência de descritores sobre gestão do conhecimento. Transinformação, v. 19, n. 1, p. 19-30, 2007.

SOUZA, R. R. Uma proposta de metodologia para indexação automática utilizando sintagmas nominais. Encontros Bibli: revista eletrônica de Biblioteconomia e Ciência da Informação, v. 11, n. esp., p. 42-59, 2006.

TUFANO, D. Estudos de língua e literatura. 4. ed. São Paulo, Moderna, 1990.

Publicado

2011-06-01

Cómo citar

Corrêa, R. F., Miranda, D. G. de, Lima, C. O. de A., & Silva, T. J. da. (2011). Indización y recuperación de tesis y disertaciones por medio de sintagmas nominales. AtoZ: Novas práticas Em informação E Conhecimento, 1(1), 11–22. https://doi.org/10.5380/atoz.v1i1.41280