Skip to main content
QUICK REVIEW

[论文解读] Complexity of Evaluating GQL Queries

Diego Figueira, Anthony W. Lin|arXiv (Cornell University)|Jul 9, 2024
Data Mining Algorithms and Applications被引用 1
一句话总结

本文確立了屬性圖資料庫標準查詢語言 GQL 的精確資料複雜度。研究證明一般 GQL 評估的複雜度為 PNP[log]-完全,而無限制子的片段則為 NL-完全,透過將其嵌入二階邏輯與嵌入式有限模型論,統一並延伸了關係查詢複雜度的既有成果。

ABSTRACT

GQL has recently emerged as the standard query language over graph databases, particularly, property graphs. Indeed, this is analogous to the role of SQL for relational databases. Unlike SQL, however, fundamental problems regarding GQL are still unsolved, most notably the complexity of query evaluation. In this paper we provide a complete solution to this problem for the core fragment of GQL and for its extension with path restrictors. In particular, we show that the data complexity of these fragments is P^NP[log]-complete in general, and drops to NL-complete when restrictors are disallowed. Using techniques from embedded finite model theory, we show that this is true, even when the queries use data from infinite concrete domains such as real numbers with arithmetic. In proving these results, we establish and exploit tight connections between GQL and query languages over relational databases, especially extensions of relational calculus with transitive closure operators and fragments of second-order logic.

研究动机与目标

  • 確定屬性圖資料庫標準查詢語言 GQL 的精確資料複雜度。
  • 彙整 GQL 理論理解上的根本缺口,類比於 SQL 複雜度的完整映射。
  • 將複雜度結果延伸至無限資料領域(如具算術運算的實數),同時維持複雜度界。
  • 建立 GQL 與關係查詢語言(特別是具遞移閉包者)之間的關聯。
  • 證明邏輯嵌入可統合並簡化圖形與關係查詢模型之間的複雜度分析。

提出的方法

  • 將 GQL 嵌入二階邏輯片段與具遞移閉包的關係演算,以分析複雜度。
  • 運用嵌入式有限模型論技術,在延伸至無限資料領域時維持資料複雜度。
  • 透過將 GQL 查詢與已知邏輯片段相互歸約,證明緊緻的複雜度界。
  • 透過顯示移除限制子可使複雜度降至 NL,分析限制子(提升複雜度之 GQL 構造)的影響。
  • 利用關係資料庫中已知的複雜度結果,透過邏輯等價性推導 GQL 的複雜度界。
  • 展示即使在實數上的算術運算下,複雜度仍維持於 PNP[log] 或 NL,取決於是否使用限制子。

实验结果

研究问题

  • RQ1在屬性圖上評估 GQL 查詢的資料複雜度為何?
  • RQ2限制子的存在如何影響 GQL 評估的複雜度?
  • RQ3GQL 的複雜度結果能否延伸至無限資料領域(如具算術運算的實數)?
  • RQ4對應於 GQL 的邏輯片段為何?與具遞移閉包的關係查詢語言有何關聯?
  • RQ5邏輯嵌入在多大程度上可簡化圖形查詢複雜度的分析?

主要发现

  • 一般 GQL 評估的資料複雜度為 PNP[log]-完全,確立了緊緻的上界與下界。
  • 當排除限制子時,GQL 的資料複雜度降至 NL-完全,與關係資料庫中標準路徑查詢的複雜度一致。
  • 即使查詢涉及無限資料領域(如實數)的算術運算,結果仍成立,且複雜度類別不變。
  • 本文確立了 GQL 與二階邏輯片段及關係演算遞移閉包擴展之間的緊緻邏輯對應關係。
  • 嵌入式有限模型論的運用,使關係與圖形查詢語言(含無限資料領域)的複雜度得以統一處理。
  • 邏輯嵌入架構允許進行超越原生 GQL 表達能力的元查詢功能(如結構描述檢查與屬性比較),同時維持複雜度界。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。