Skip to main content
QUICK REVIEW

[论文解读] In-Memory Object Graph Stores

Renzo Angles, János Benjamin Antal|arXiv (Cornell University)|Jan 7, 2020
Peer-to-Peer Network Technologies被引用 14
一句话总结

LDBC 社交网络基准测试(v2.2.4)通过两种工作负载定义了一个标准化框架,用于评估图数据库系统:交互式(事务性查询)和商业智能(分析性查询)。它规定了逼真的社交网络数据模型、查询工作负载、数据生成流程和执行规则,以实现跨多种图技术的公平、可复现且与行业相关的性能比较。

ABSTRACT

The Linked Data Benchmark Council's Social Network Benchmark (LDBC SNB) is an effort intended to test various functionalities of systems used for graph-like data management. For this, LDBC SNB uses the recognizable scenario of operating a social network, characterized by its graph-shaped data. LDBC SNB consists of two workloads that focus on different functionalities: the Interactive workload (interactive transactional queries) and the Business Intelligence workload (analytical queries). This document contains the definition of both workloads. This includes a detailed explanation of the data used in the LDBC SNB, a detailed description for all queries, and instructions on how to generate the data and run the benchmark with the provided software.

研究动机与目标

  • 建立一个公平、真实且可扩展的基准测试,用于评估用于社交网络应用的图数据库系统。
  • 在一个基准测试框架中同时支持事务性(交互式)和分析性(商业智能)工作负载。
  • 在包括原生图数据库、RDF 存储和关系型系统在内的多种图技术之间,实现可复现的性能评估。
  • 提供完整的技术栈——包括数据模式、查询定义、数据生成工具和执行规则——以方便工业界和学术界轻松采用。
  • 通过识别系统瓶颈并指导可扩展、高效的图数据管理研究,推动技术创新。

提出的方法

  • 定义了一个图状的社交网络数据模型,包含实体(例如:Person、Forum、Message)和关系(例如:knows、created、repliedTo)。
  • 规定了两种不同的工作负载:交互式(v1 和 v2)用于 OLTP 风格的事务性查询,以及商业智能工作负载用于分析性、复杂模式匹配查询。
  • 引入一种可扩展的数据生成流程,使用可配置的规模因子和逼真的分布(例如:优先连接、幂律分布),以模拟真实的社交网络。
  • 通过更新流支持动态数据操作,包括插入和删除,并通过实体生命周期管理来模拟现实世界中的数据衰减。
  • 提供正式的查询描述格式,包含替换参数、返回值规范和执行规则,以确保基准测试的一致性。
  • 包含审计和披露规则,以确保基准测试结果的透明性和可复现性。

实验结果

研究问题

  • RQ1如何设计一个标准化基准测试,以公平评估不同使用模式下的多样化图数据库系统?
  • RQ2哪种数据生成策略最能捕捉真实社交网络在结构和时间上的真实性,同时保持可扩展性和可配置性?
  • RQ3如何将交互式事务性工作负载和分析性工作负载模式一致地整合到一个基准测试框架中?
  • RQ4哪些机制能够确保在不同系统和部署环境中,基准测试执行的一致性、可复现性和可审计性?
  • RQ5如何对生命周期管理和删除操作进行建模,以反映图数据库中现实世界的数据动态?

主要发现

  • LDBC SNB v2.2.4 提供了一个全面、开放且可扩展的基准测试框架,已被工业界和学术界广泛采用,用于评估图数据库系统。
  • 该基准测试支持从 1GB 到 100TB 的规模因子的逼真数据生成,使系统在广泛容量范围内的评估成为可能。
  • 同时包含交互式和分析性工作负载,使系统在 OLTP 和 OLAP 工作负载下的整体评估成为可能。
  • 使用替换参数和正式的查询定义,确保了不同系统之间查询执行的一致性和可复现性。
  • 基准测试中的生命周期和删除建模能够真实模拟数据演化过程,包括社交网络中的级联删除。
  • 该基准测试已扩展以支持新工作负载,例如包含深度删除操作的交互式 v2 工作负载,以及用于路径查找查询的参数优化。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。