Skip to main content
QUICK REVIEW

[論文レビュー] Database Theory in Action: Cypher, GQL, and Regular Path Queries

Alin Deutsch, Nadime Francis|arXiv (Cornell University)|Dec 12, 2021
Semantic Web and Ontologies被引用数 3
ひとこと要約

本論文は、GQLとSQL/PGQの両者に共通して採用されるコアクエリ言語標準であるGPML(Graph Pattern Matching Language)を提示する。この言語は、SQLおよびネイティブグラフデータベースの間でプロパティグラフのクエリを統合的に扱えるようにし、変数を用いたパスパターンマッチング、パスバインディング、多重性を考慮した集計を形式化することで、産業界および学術分野のシステムにおいて一貫性のある標準化されたグラフパターンマッチングを実現する。

ABSTRACT

As graph databases become widespread, JTC1 -- the committee in joint charge of information technology standards for the International Organization for Standardization (ISO), and International Electrotechnical Commission (IEC) -- has approved a project to create GQL, a standard property graph query language. This complements a project to extend SQL with a new part, SQL/PGQ, which specifies how to define graph views over an SQL tabular schema, and to run read-only queries against them. Both projects have been assigned to the ISO/IEC JTC1 SC32 working group for Database Languages, WG3, which continues to maintain and enhance SQL as a whole. This common responsibility helps enforce a policy that the identical core of both PGQ and GQL is a graph pattern matching sub-language, here termed GPML. The WG3 design process is also analyzed by an academic working group, part of the Linked Data Benchmark Council (LDBC), whose task is to produce a formal semantics of these graph data languages, which complements their standard specifications. This paper, written by members of WG3 and LDBC, presents the key elements of the GPML of SQL/PGQ and GQL in advance of the publication of these new standards.

研究の動機と目的

  • GQLとSQL/PGQの両方のための共通の標準化されたグラフパターンマッチング言語(GPML)を定義し、プロパティグラフシステム間での相互運用性を確保すること。
  • GPMLの意味論を形式化し、多様な実装間で正確で一貫したクエリ評価を可能にすること。
  • ISO/IEC JTC1 SC32 WG3から得られる共通の設計原則を活用して、GQLとSQL/PGQのコアクエリ言語を1つの仕様に統合すること。
  • プロパティグラフデータベースの広範な採用にもかかわらず、標準化されたプロパティグラフクエリ言語が存在しないという課題に対処すること。
  • Cypher や PGQL といった産業界の言語から得られる機能(パスバインディング、集計、サイクル処理など)を統合することで、実世界のグラフワークロードを効果的にサポートすること。

提案手法

  • GQLとSQL/PGQの共有サブ言語としてGPMLを定義し、パス変数および多重性に敏感な集計を拡張した結合的正則パスクエリ(CRPQs)に基づく。
  • ノードおよびエッジへの変数バインディングを用いたパスパターンマッチングを形式化し、パスレベルの変数およびプロパティアクセスをサポートする。
  • 細かく定義されたマッチング意味論を導入し、異なるパスバインディングを区別し、パス制限子(例:単純パス、トレール)を用いたフィルタリングを可能にする。
  • 既存の産業界のクエリ言語(Cypher、PGQL、GSQL)を設計の基盤としながら、ベンダ固有の構文を抽象化する。
  • LDBC学術ワーキンググループを活用して、標準規格を補完する形式的意味論を開発する。
  • GQLとSQL/PGQの両方で同じパターンを評価する際に同一の動作を保証するため、コアGPMLエンジン論理を統合する。

実験結果

リサーチクエスチョン

  • RQ1GQLとSQL/PGQを統合しつつ、それぞれの独自のユースケースを保ったまま、共通のグラフパターンマッチング言語をどのように設計できるか?
  • RQ2異なるシステム間でパスパターンの評価が一貫的かつ予測可能になるようにするための形式的意味論は、どのようなものである必要があるか?
  • RQ3パス制限子(例:単純パス、トレール)は、グラフクエリの計算複雑性および実用的使いやすさにどのように影響を与えるか?
  • RQ4既存の産業界の言語(例:Cypher、PGQL)から、実世界での表現力を確保するためにGPMLに含める必要がある機能は何か?
  • RQ5パスレベルの変数およびパス上の集計を形式的に定義し、標準化されたクエリ言語に統合するにはどうすればよいか?

主な発見

  • GPMLは、GQLとSQL/PGQの共通のコアとして形式的に定義されており、両者の標準間でパスパターンの評価が同一であることを保証する。
  • GPMLはパス変数および多重性を考慮した集計(例:count、sum、average)をサポートしており、従来のCRPQよりも表現力が高く意味論的に明確なクエリを可能にする。
  • 『単純パス』や『トレール』といったパス制限子は、洗練された設計により、計算複雑性の懸念を解消しつつ、形式的意味論とともに再導入された。
  • LDBC学術グループが開発した形式的意味論は、GQLおよびSQL/PGQの規範的仕様を補完する厳密な基盤を提供する。
  • GPMLが両標準に統合されることで、同じクエリがネイティブグラフデータベース(GQL)で実行されても、SQLベースのグラフビュー(SQL/PGQ)で実行されても、同一の結果が得られる。
  • 設計は表現力とパフォーマンスのバランスをうまく保っており、複雑なグラフパターンをサポートしつつ、制御されたパス列挙により非終了の問題を回避している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。