Um estudo do impacto da modelagem de dados no desempenho de consultas nos SGBD NoSQL orientados a documentos

Os SGBD NoSQL surgiram como solução alternativa às limitações dos SGBD Relacionais, com relação ao gerenciamento do crescente volume de dados, e ao seu tratamento distribuído. Esses sistemas além de possuir uma maior facilidade em distribuir os seus dados, permitem uma maior flexibilidade de esquema...

Descripción completa

Detalles Bibliográficos
Autor: Soransso, Raphael Augusto da Silva Nunes
Tipo de recurso: tesis de maestría
Estado:Versión publicada
Fecha de publicación:2017
País:Brasil
Institución:Marinha do Brasil (MB)
Repositorio:Repositório Institucional da Produção Científica da Marinha do Brasil (RI-MB)
Idioma:portugués
OAI Identifier:oai:www.repositorio.mar.mil.br:ripcmb/844352
Acceso en línea:http://www.repositorio.mar.mil.br/handle/ripcmb/844352
Access Level:acceso abierto
Palabra clave:Benchmark
NoSQL
Modelagem de Dados
Descripción
Sumario:Os SGBD NoSQL surgiram como solução alternativa às limitações dos SGBD Relacionais, com relação ao gerenciamento do crescente volume de dados, e ao seu tratamento distribuído. Esses sistemas além de possuir uma maior facilidade em distribuir os seus dados, permitem uma maior flexibilidade de esquema e são mais tolerantes à inconsistência. Da mesma forma que nos SGBD relacionais, a modelagem lógica dos dados pode influenciar significativamente o desempenho neste tipo de SGBD. Em especial, quando o objetivo é atender aplicações analíticas. Apesar de existir em alguns trabalhos que buscam orientar a modelagem de dados nos SGBD NoSQL e trabalhos que realizam a avaliação da performance desses sistemas, até onde foi possível investigar, não foram encontrados na literatura trabalhos que demonstrem o quanto as diferentes formas de modelagem dos dados, e mais especificamente da modelagem dos agregados nos SGBD orientados a documentos, podem influenciar no desempenho das consultas neste tipo de sistema. Sem tais estudos,torna-se difícil identificar a melhor alternativa de modelagem de agregados, de forma a melhorar o desempenho das consultas. Assim, o presente trabalho tem como objetivo preencher esta lacuna e fornecer aos administradores de bancos de dados, orientações de como os dados podem ser modelados de forma a obter melhor desempenho em SGBD orientados a documentos, para consultas analíticas. Para tanto, foram realizados experimentos em cinco SGBD orientados a documentos, utilizando um conjunto de dados, oriundo de um conhecido benchmark voltado para aplicações de suporte à decisão. A partir dos resultados dos experimentos foi possível propor heurísticas de modelagem de dados, em algumas das implementações de SGBD estudadas, que foram validadas em outro conjunto de dados oriundo de outro benchmark com objetivos similares ao primeiro. No final do trabalho, foram realizados ainda, um estudo complementar sobre o impacto da modelagem dos agregados na performance das consultas, ao utilizar o recurso de índices, e uma comparação de desempenho entre as implementações estudadas.