Tesauros de asociación y similitud para la expansión automática de consultas. Algunos resultados experimentales

En los sistemas de recuperación de información uno de los aspectos que más condiciona los resultados es la formulación de la consulta. Ello supone seleccionar los términos que semánticamente se ajusten más a la necesidad informativa del usuario. Lamentablemente, figuras lingüísticas como la polisemi...

Descripción completa

Detalles Bibliográficos
Autores: Zazo Rodríguez, Ángel Francisco, García de Figuerola Paniagua, Luis Carlos, Alonso Berrocal, José Luis, Rodríguez Vázquez de Aldana, Emilio
Tipo de recurso: informe técnico
Fecha de publicación:2002
País:España
Institución:Universidad de Salamanca (USAL)
Repositorio:GREDOS. Repositorio Institucional de la Universidad de Salamanca
OAI Identifier:oai:gredos.usal.es:10366/21725
Acceso en línea:http://hdl.handle.net/10366/21725
Access Level:acceso abierto
Palabra clave:Expansión automática de consultas
Tesauros de asociación
Tesauros de similitud
Normalización de la consulta
Information retrieval
Automatic query expansion
Association thesaurus
Similarity Thesaurus
Normalization of the query
Recuperación de la información
Descripción
Sumario:En los sistemas de recuperación de información uno de los aspectos que más condiciona los resultados es la formulación de la consulta. Ello supone seleccionar los términos que semánticamente se ajusten más a la necesidad informativa del usuario. Lamentablemente, figuras lingüísticas como la polisemia y la sinonimia hacen que esta tarea no se nada fácil. Las técnicas que intentan reducir en lo posible el problema parten generalmente de una primera consulta, y estudian cómo puede modificarse para obtener mejores resultados. Uno de los mecanismos utilizados se conoce como expansión automática de consultas. Esta expansión consiste, primero, en añadir nuevos términos a la consulta original, y segundo, calcular el peso de dichos términos en la nueva consulta. Para llevar a cabo la expansión de consultas se han planteado varios mecanismos, uno de ellos es la utilización de un tesauro construido automáticamente a partir de la colección de documentos. En este trabajo hemos experimentado con dos tipos de tesauros: de asociación y de similitud. Estos stesauros recogen las relaciones entre los términos de la colección documental, y sirven para expandir los términos originales de la consulta con aquellos más relacionados. Uno de los aspectos más importantes de tal expansión consiste en determinar el peso de los términos expandidos. En este sentido, también hemos realizado varios experimentos que muestran la dependencia entre la elección del mecanismo de pesado y los resultados, así como la influencia de la normalización de la consulta original en los mismos.