Back to Search Start Over

Benchmarks benchmark analysis for property graph oriented NoSQL database

Authors :
Silva, Laís Bethânia Brito
Ciferri, Ricardo Rodrigues
Source :
Repositório Institucional da UFSCAR, Universidade Federal de São Carlos (UFSCAR), instacron:UFSCAR
Publication Year :
2021
Publisher :
Universidade Federal de São Carlos, 2021.

Abstract

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) The new era of data economics, based on data sets with enormous volume, wide variety of formats, and rapid speed in data production and utilization, has brought the need for new data management structures and methods. Then come Not Only SQL (NoSQL) databases, which provide a new way of storing and retrieving data with features that go beyond relational database management systems. NoSQL databases are divided into four major models: key -value, column-oriented, document-oriented and graph-oriented. They are able to scalably handle the storage and processing of gigantic volumes of data with a flexible format, where manipulations are not exclusively performed through the SQL language. These data sets, many of which, modeled as large graphs, to - a challenge for industry and academia, which has been increasingly committed to research and innovation in the area. Thus, there is a natural increase in demand for performance analysis systems for Graph Oriented NoSQL Databases. This implies the need for new benchmarks capable of testing these new technologies and that guide users to identify tools that best adapt to their applications. Many studies approach the proposal of benchmarks for an analysis of Graph Oriented NoSQL Database systems. However, no study studies the comparison of such benchmarks. Thus, this Master's research work aimed to carry out a comparative analysis of benchmarks for performance evaluation of Graph Oriented NoSQL Databases, with specific emphasis on the property graph model, and thus highlight as main differences between these, in addition to identifying strengths and limitations of each benchmark. Thus, it becomes possible to identify the most appropriate benchmark to analyze the performance of Property Graph-Oriented NoSQL Database systems according to a set of requirements of a specific domain. Application. Among the several existing benchmarks, it was investigated to compare the LDBC SNB, XGDBench, HPC-SGAB, TGDB and Cyclone benchmarks. In general terms, the LDBC-SNB benchmark stood out in relation to the other benchmarks, especially when it comes to query types and performance measures, and because of its tester support for several graph-oriented NoSQL DBMS's. A nova era da economia de dados, baseada em conjuntos de dados com enorme volume, grande variedade de formatos e rápida velocidade na produção e utilização de dados, trouxe a necessidade de novas estruturas e métodos de gerenciamento de dados. Surgem então os bancos de dados Not Only SQL (NoSQL), que fornecem uma nova forma de armazenamento e recuperação dedados com capacidades que vão além dos sistemas gerenciadores de bancos de dados relacionais.Bancos de dados NoSQL são divididos em quatro grandes modelos: chave-valor, orientados à colunas, orientados a documentos e orientados a grafos. São capazes de lidar de forma escalável com o armazenamento e o processamento de gigantescos volumes de dados com formato flexível, onde as manipulações não são exclusivamente realizadas por meio da linguagem SQL. Esses conjuntos de dados, muitos dos quais, modelados como grandes grafos, tornaram-se um desafio para a indústria e a academia, que vem se empenhando cada vez mais em pesquisa e inovação na área. Assim, naturalmente ocorre o aumento da demanda por sistemas de análise de desempenho de Bancos de Dados NoSQL Orientados a Grafos. Isso implica na necessidade de novos benchmarks capazes de testar essas novas tecnologias e que orientemos usuários a identificar as ferramentas que melhor se adéquem às suas aplicações. Muitos estudos têm abordado a proposta de benchmarks para a análise dos sistemas de Bancos de Dados NoSQL Orientados a Grafos. Porém, nenhum estudo descreve a comparação detalhada desses benchmarks. Dessa forma, este trabalho de pesquisa de Mestrado teve por objetivo realizar uma análise comparativa de benchmarks para avaliação de desempenho de Bancos de Dados NoSQL Orientados a Grafos, com ênfase especificamente no modelo de grafos de propriedade, e assim destacar as principais diferenças entre esses, além de identificar pontos positivos e limitações de cada benchmark. Assim, torna-se possível identificar o benchmark mais adequado para analisar o desempenho de sistemas de Bancos de Dados NoSQL Orientados a Grafos de Propriedades em função de um conjunto de requisitos de um domínio específico de aplicação. Dentre os diversos benchmarks existentes, foi investigada a relevância dos benchmarks LDBC SNB, XGDBench, HPC, TGDB e Cyclone. Em termos gerais, o benchmark LDBC-SNB se sobressaiu em relação aos outros benchmarks, principalmente quando se trata dos tipos de consultas e medidas de desempenho e por prover suporte a diversos SGBD’s NoSQL orientados a grafos. CAPES/DS (01/08/2018 a 17/07/2020)

Details

Language :
Portuguese
Database :
OpenAIRE
Journal :
Repositório Institucional da UFSCAR, Universidade Federal de São Carlos (UFSCAR), instacron:UFSCAR
Accession number :
edsair.od......3056..3b11c311b5b775b13706d81edcd0054d