Termos, relacionamentos e representatividade na indexação de texto para recuperação de informação

Uma das fases da recuperação de informação é a indexação dos textos dos documentos. Nesta fase, um conjunto de descritores (termos e/ou relacionamentos entre termos) descreve conceitos (atômicos e/ou complexos) presentes nos textos. Diversas estratégias com tais finalidades são encontrados na biblio...

Descripción completa

Detalles Bibliográficos
Autores: Gonzalez, Marco Antonio Insaurriaga, Lima, Vera Lucia Strube de, Lima, Jose Valdeni de
Tipo de recurso: artículo
Estado:Versión publicada
Fecha de publicación:2006
País:Brasil
Institución:Universidade Federal do Rio Grande do Sul (UFRGS)
Repositorio:Repositório Institucional da UFRGS
Idioma:portugués
OAI Identifier:oai:www.lume.ufrgs.br:10183/169681
Acceso en línea:http://hdl.handle.net/10183/169681
Access Level:acceso abierto
Palabra clave:Armazenamento : Dados
Recuperacao : Informacao
Indexacao : Documentos
Descripción
Sumario:Uma das fases da recuperação de informação é a indexação dos textos dos documentos. Nesta fase, um conjunto de descritores (termos e/ou relacionamentos entre termos) descreve conceitos (atômicos e/ou complexos) presentes nos textos. Diversas estratégias com tais finalidades são encontrados na bibliografia, algumas consideram dependência de termos e outras não. Com o objetivo de apresentar uma visão geral das estratégias de representação de textos que consideram dependência de termos, são descritas quatro experiências onde as representatividades dos relacionamentos dependem dos termos componentes (estratégias com índices múltiplos, com árvore binária, com triplas e com famílias morfológicas), três onde as representatividades dos relacionamentos dependem de suas próprias freqüências de ocorrência (estratégias com expressões de índice, com pares lematizados e com expressões ternárias), duas onde os relacionamentos são reconhecidos mas não são utilizados como descritores (estratégias com nodos temáticos e com conexões gramaticais) e uma experiência onde os relacionamentos são eminentemente estatísticos (estratégia com bitermos).