Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação

O advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de bus...

Descripción completa

Detalles Bibliográficos
Autor: Pereira, Alexandre Neiva
Tipo de recurso: tesis de maestría
Estado:Versión publicada
Fecha de publicación:2010
País:Brasil
Institución:Universidade Estadual do Ceará
Repositorio:Repositório Institucional da UECE
Idioma:portugués
OAI Identifier:oai:uece.br:67646
Acceso en línea:https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
Access Level:acceso abierto
Palabra clave:Computação aplicada
Indexacao
Recuperacao de Informacao
id BR_e39d45d84199ed6ee297e0bde2b6d1ec
oai_identifier_str oai:uece.br:67646
network_acronym_str BR
network_name_str Brasil
repository_id_str
spelling Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informaçãoComputação aplicada Indexacao Recuperacao de InformacaoO advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de busca automáticos tornaram-se essenciais. Estes mecanismos, como o popular Google, assim como outros vários sistemas de RI disponíveis no mercado, deveriam retornar as consultas dos usuários com qualidade maior do que a apresentada na atualidade. A eficácia do resultado recuperado pelo sistema de RI revela-se, portanto, de extrema importância, e consequentemente, a performance de uma de suas principais fases, a indexação. A fase de indexação é composta por alguns passos. Este trabalho aborda o passo do Cálculo da Representatividade, que é realizado atualmente por funções como TF.IDF, BM25 e BM25F. Por meio do cálculo da representatividade é possível ordenar os termos do mais relevante ao menos relevante em cada documento. Neste trabalho são apresentadas novas técnicas que combinam o Cálculo de Representatividade ao conceito de zoneamento. O zoneamento consiste em particionar o texto em regiões com o objetivo de conceder maior representatividade a termos que aparecem em regiões específicas. Palavras-chave: Recuperação de informação. Indexação. Representatividade do termo.Ver documento original.Universidade Estadual do CearáGustavo Augusto Lima de Campos2011-04-13T00:00:00Z2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UECEinstname:Universidade Estadual do Cearáinstacron:UECEPereira, Alexandre Neiva2011-04-13T00:00:00Zoai:uece.br:67646Repositório InstitucionalPUBhttps://siduece.uece.br/siduece/api/oai/requestopendoar:2011-04-13T00:00Repositório Institucional da UECE - Universidade Estadual do Cearáfalse
dc.title.none.fl_str_mv Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
spellingShingle Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
Pereira, Alexandre Neiva
Computação aplicada
Indexacao
Recuperacao de Informacao
title_short Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_full Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_fullStr Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_full_unstemmed Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_sort Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
dc.creator.none.fl_str_mv Pereira, Alexandre Neiva
author Pereira, Alexandre Neiva
author_facet Pereira, Alexandre Neiva
author_role author
dc.contributor.none.fl_str_mv Gustavo Augusto Lima de Campos
dc.subject.por.fl_str_mv Computação aplicada
Indexacao
Recuperacao de Informacao
topic Computação aplicada
Indexacao
Recuperacao de Informacao
description O advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de busca automáticos tornaram-se essenciais. Estes mecanismos, como o popular Google, assim como outros vários sistemas de RI disponíveis no mercado, deveriam retornar as consultas dos usuários com qualidade maior do que a apresentada na atualidade. A eficácia do resultado recuperado pelo sistema de RI revela-se, portanto, de extrema importância, e consequentemente, a performance de uma de suas principais fases, a indexação. A fase de indexação é composta por alguns passos. Este trabalho aborda o passo do Cálculo da Representatividade, que é realizado atualmente por funções como TF.IDF, BM25 e BM25F. Por meio do cálculo da representatividade é possível ordenar os termos do mais relevante ao menos relevante em cada documento. Neste trabalho são apresentadas novas técnicas que combinam o Cálculo de Representatividade ao conceito de zoneamento. O zoneamento consiste em particionar o texto em regiões com o objetivo de conceder maior representatividade a termos que aparecem em regiões específicas. Palavras-chave: Recuperação de informação. Indexação. Representatividade do termo.
publishDate 2010
dc.date.none.fl_str_mv 2010
2011-04-13T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
url https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual do Ceará
publisher.none.fl_str_mv Universidade Estadual do Ceará
dc.source.none.fl_str_mv reponame:Repositório Institucional da UECE
instname:Universidade Estadual do Ceará
instacron:UECE
instname_str Universidade Estadual do Ceará
instacron_str UECE
institution UECE
reponame_str Repositório Institucional da UECE
collection Repositório Institucional da UECE
repository.name.fl_str_mv Repositório Institucional da UECE - Universidade Estadual do Ceará
repository.mail.fl_str_mv
_version_ 1853660511159189504
score 15,127369