[論文レビュー] Enumeration Problems for Regular Path Queries
本稿は、任意、最短、単純路、およびトレイルというさまざまな意味論における正則パス照会(RPQ)の結果の列挙を調査し、多項式遅延およびパラメータ化複雑性に焦点を当てる。広範な実用的RPQ(単純推移的式)のクラスにおいて、単純路とトレイルの列挙がFPT遅延で達成可能であることが示され、実世界の照会ワークロードにおける長年の複雑性の課題が解決された。
Evaluation of regular path queries (RPQs) is a central problem in graph databases. We investigate the corresponding enumeration problem, that is, given a graph and an RPQ, enumerate all paths in the graph that match the RPQ. We consider several versions of this problem, corresponding to different semantics of RPQs that have recently been considered: arbitrary paths, shortest paths, simple paths, and trails. Whereas arbitrary and shortest paths can be enumerated in polynomial delay, the situation is much more intricate for simple paths and trails. For instance, already the question if a given graph contains a simple path or trail of a certain length has cases with highly non-trivial solutions and cases that are long-standing open problems. In this setting, we study RPQ evaluation from a parameterized complexity perspective. We define a class of simple transitive expressions that is prominent in practice and for which we can prove two dichotomy-like results: one for simple paths and one for trails paths. We observe that, even though simple path semantics and trail semantics are intractable for RPQs in general, they are feasible for the vast majority of the kinds of RPQs that users use in practice. At the heart of this study is a result of independent interest on the parameterized complexity of finding disjoint paths in graphs: the two disjoint paths problem is W[1]-hard if parameterized by the length of one of the two paths.
研究の動機と目的
- 異なる意味論(任意、最短、単純路、トレイル)における正則パス照会(RPQ)に一致するパスの列挙の複雑性を分析すること。
- 単純路およびトレイルの列挙が一般には非効率的であるが、実際には一般的であるという課題に対処すること。
- 列挙を効率的に行えるRPQの tractable(処理可能)な部分クラスを同定すること、特に単純推移的式に焦点を当てる。
- これらの部分クラスについて、単純路およびトレイル意味論の下でパラメータ化された処理可能性(FPT遅延)を確立すること。
- 実世界のSPARQLおよびCypherワークロードで一般的に見られる実用的RPQが、一般には理論的に非効率であるが、単純路およびトレイル意味論の下で効率的な列挙を可能にすることを示すこと。
提案手法
- 照会およびデータサイズに関する結合複雑性を対象として、RPQ列挙のパラメータ化複雑性分析を提案する。
- 最短パス計算のためのコアサブルーチンとしてイェンのアルゴリズムを用い、多項式遅延を達成するパス列挙に適応する。
- エッジの再ラベル化およびグラフと正規表現の構造的変換を用いて、トレイル列挙を単純路列挙に還元する。
- カラーリング技法および正規表現の導出に基づく分析を用いて、部分パス制約および競合のないラベル処理を扱う。
- アッカーマンとシャライトのアルゴリズムの変更版を用いて、A*式の辞書式に最小のパスを計算する。
- 「カット可能な」および「ほとんど競合のない」正規表現の概念を活用し、パラメータ化された複雑性が有界であることを保証する。
実験結果
リサーチクエスチョン
- RQ1単純路およびトレイル意味論における正則パス照会の列挙は、多項式遅延で行えるか?
- RQ2照会構造をパラメータとする場合、単純路およびトレイル列挙が固定パラメータ可 tractable(FPT)であるような実用的RPQの部分クラスは存在するか?
- RQ3有向グラフにおける互いに素なパスの探索のパラメータ化された複雑性は何か? そしてこれはRPQ列挙とどのように関連するか?
- RQ4実世界のRPQ(SPARQLログから得たもの)は、効率的な列挙を可能にする構造的単純性をどの程度示しているか?
- RQ5任意、最短、単純、およびトレイルパスの意味論は、実際の列挙の処理可能性にどの程度影響を与えるか?
主な発見
- RPQの任意および最短パス一致の列挙は、多項式遅延で達成可能である。
- 単純推移的式(STE)において、単純路およびトレイルの列挙は両方ともFPT遅延に属し、実用的照会の広範なクラスにおける処理可能性を示している。
- 1つのパスの長さをパラメータとする場合、2つの互いに素なパス問題はW[1]-hardであることが判明し、パス探索サブルーチンにおけるコアな非効率性を示している。
- トレイル列挙から単純路列挙への還元は、パスの対応関係を保持し、効率的なアルゴリズムの再利用を可能にする。
- ラベル集合が有界で、ほとんど競合のないSTEについては、基数順でFPT遅延での列挙が可能である。
- 一般にはNPおよび#P完全であるが、実世界のワークロードで一般的に見られる実用的RPQは、単純路およびトレイル意味論の下で効率的な列挙を可能にすることが結果として示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。