Sistemas de informação em linguagem natural : em busca de uma indexação automática

Este artigo aborda o tratamento automático de linguagens naturais, particularmente a descrição do conteúdo informacional de textos, para melhorar sua indexação e preencher os requisitos dos sistemas de informação documentária, a partir de elementos fornecidos pela estruturação dos sintagmas nominais...

Descripción completa

Detalles Bibliográficos
Autor: Brito, Marcílio de
Tipo de recurso: artículo
Estado:Versión publicada
Fecha de publicación:1992
País:Brasil
Institución:Universidade de Brasília (UnB)
Repositorio:Repositório Institucional da UnB
Idioma:portugués
OAI Identifier:oai:repositorio.unb.br:10482/12892
Acceso en línea:http://repositorio.unb.br/handle/10482/12892
Access Level:acceso abierto
Palabra clave:Recuperação da informação
Indexação automática
Linguagem natural
Linguagem documentária
Descripción
Sumario:Este artigo aborda o tratamento automático de linguagens naturais, particularmente a descrição do conteúdo informacional de textos, para melhorar sua indexação e preencher os requisitos dos sistemas de informação documentária, a partir de elementos fornecidos pela estruturação dos sintagmas nominais (SN). Uma nova ferramenta para análise morfossintática foi criada e desenvolvida com a linguagem de programação Starlet, baseada na teoria de Gramáticas Afixos, gramáticas em dois níveis, resultante do trabalho anterior de C. H. A. Koster. Usando-se gramáticas em dois níveis, aumentou-se a capacidade descritiva desta nova linguagem e produziu-se um simples e elegante modelo que possibilitou uma representação mais detalhada dos procedimentos de análise. Um corpo maior constituído de textos da Agence France Presse (AFP News Brieves) foi usado para testar o analisador morfossintático. Os resultados demonstraram claramente a capacidade das gramáticas em dois níveis para alcançar a formalização de fenômenos lingüísticos. As vantagens importantes deste método repousam na capacidade de se ter controle mais específico sobre a aplicação das regras de análise. Uma descrição mais sintática conduza programas mais bem adaptados ao meio computadorizado e às necessidades lingüísticas.