[論文レビュー] Combined Tractability of Query Evaluation via Tree Automata and Cycluits
この論文は、分類されたネガーションを備えたDatalogの断片、すなわち拡張的クランプ付きDatalog(ICG-Datalog)を導入する。この言語は、ルールサイズをパrameterとする固定パrameter可 tractable(FPT)線形評価を、有界木幅のデータベース上で可能にする。これは、クエリを交互な双方向木オートマトンにコンパイルし、分類された意味を持つ循環的プロビジョニング回路(cycluits)を用いて効率的な評価を実現することで達成される。一方で、確率的クエリ評価はこのパrameter化のもとでも不審なままであることが示されている。
Several query evaluation tasks can be done via knowledge compilation: the query result is compiled as a lineage circuit from which the answer can be determined. For such tasks, it is important to leverage some width parameters of the circuit, such as bounded treewidth or pathwidth, to convert the circuit to structured classes, e.g., deterministic structured NNFs (d-SDNNFs) or OBDDs. In this work, we show how to connect the width of circuits to the size of their structured representation, through upper and lower bounds. For the upper bound, we show how bounded-treewidth circuits can be converted to a d-SDNNF, in time linear in the circuit size. Our bound, unlike existing results, is constructive and only singly exponential in the treewidth. We show a related lower bound on monotone DNF or CNF formulas, assuming a constant bound on the arity (size of clauses) and degree (number of occurrences of each variable). Specifically, any d-SDNNF (resp., SDNNF) for such a DNF (resp., CNF) must be of exponential size in its treewidth; and the same holds for pathwidth when compiling to OBDDs. Our lower bounds, in contrast with most previous work, apply to any formula of this class, not just a well-chosen family. Hence, for our language of DNF and CNF, pathwidth and treewidth respectively characterize the efficiency of compiling to OBDDs and (d-)SDNNFs, that is, compilation is singly exponential in the width parameter. We conclude by applying our lower bound results to the task of query evaluation.
研究の動機と目的
- 結合クエリ評価が固定パラメータ可 tractable となるクエリおよびデータベースのクラスを同定すること。
- 木構造的(有界木幅)データベースにおけるクエリ評価の、 tractable な結合複雑度のギャップを埋めること。
- 自動機とプロビジョニング追跡を用いた効率的評価を可能にするコンパイルフレームワークを開発すること。
- 確率的クエリ評価が、提案されたパラメータ化のもとでも不審なままであることを示すこと。
- 有界木幅にクランプを加えた状況下で、二方向正則パスクエリやα-非巡回結合クエリのようなクエリクラスの tractability を形式化し、証明すること。
提案手法
- 分類されたネガーション、クランプ、インフレーション固定点を備えたDatalog断片であるICG-Datalogを提案する。
- 有界木幅のインスタンス上で効率的な評価を可能にするために、ICG-Datalogプログラムを交互な双方向木オートマトンにコンパイルする。
- 自動機のプロビジョニングを線形時間で表現・評価できる、分類された意味を持つ循環的プロビジョニング回路(cycluits)を導入する。
- tractability の構造的パラメータとして、クランプを含む木分解(単体的分解)を用いる。
- 再帰と双方向走査を処理するための、cycluitsによる自動機の新しい操作的意味論を採用する。
- 自動機の空性テストにクエリ評価を還元し、有界木幅インスタンスの木構造的性質を活用する。
実験結果
リサーチクエスチョン
- RQ1有界木幅のデータベースにおけるクエリ評価について、固定パラメータ可 tractable(FPT)線形結合複雑度を達成できるか?
- RQ2有界木幅下で、α-非巡回結合クエリや二方向正則パスクエリといった tractable クエリクラスを捉えることができるDatalog断片を定義できるか?
- RQ3再帰と双方向走査を効率的に処理できる、自動機ベースのクエリコンパイルにおけるプロビジョニング表現は存在するか?
- RQ4分類された循環的回路(cycluits)は線形時間で評価可能であり、ブール回路や論理式の代替として実用的か?
- RQ5提案されたパラメータ化が、確率的クエリ評価の tractability を保つのか?
主な発見
- ICG-Datalogは、ルールサイズをパラメータとする有界木幅のデータベースにおけるクエリ評価について、FPT線形結合複雑度を実現する。
- この言語は、α-非巡回結合クエリ、有界CQランクのガード付きネガーション断片クエリ、二方向正則パスクエリをすべて捉える。
- cycluitsは、交互な双方向オートマトンのプロビジョニングを線形時間で評価可能であり、再帰や双方向走査の処理において、従来の論理式や回路よりも優れている。
- 有界木幅のクエリだけでは、自動機へのコンパイルが効率的でないことが、下界により示された。木幅だけでは不十分であり、クランプがなければならぬ。
- 確率的クエリ評価は、提案されたパラメータ化のもとでも、結合複雑度において不審なままである。
- 単項Datalogの包含関係が、有界木幅の結合クエリにおいて2EXPTIME-hardであることが同定され、一般の上界と一致する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。