[論文レビュー] Rewriting Ontological Queries into Small Nonrecursive Datalog Programs
本稿では、DL-Lite や Linear Datalog ± で表現された知識ベースクエリを、サイズの指数的増大を回避する小規模で非再帰的な Datalog プログラムに多項式時間で再書き換えする手法を提示する。主な貢献は、関係の生成依存関係(tuple-generating dependencies)が多項式的証拠性(Polynomial Witness Property)を満たす場合に、このような再書き換えが存在し、かつ効率的に構築可能であることを証明することにある。
We consider the setting of ontological database access, where an Abox is given in form of a relational database D and where a Boolean conjunctive query q has to be evaluated against D modulo a Tbox T formulated in DL-Lite or Linear Datalog+/-. It is well-known that (T,q) can be rewritten into an equivalent nonrecursive Datalog program P that can be directly evaluated over D. However, for Linear Datalog? or for DL-Lite versions that allow for role inclusion, the rewriting methods described so far result in a nonrecursive Datalog program P of size exponential in the joint size of T and q. This gives rise to the interesting question of whether such a rewriting necessarily needs to be of exponential size. In this paper we show that it is actually possible to translate (T,q) into a polynomially sized equivalent nonrecursive Datalog program P.
研究の動機と目的
- DL-Lite や Linear Datalog ± を用いた場合の知識ベースデータベースにおけるクエリ再書き換えにおける指数的増大問題に対処すること。特に役割包含(role inclusion)を含む場合を想定する。
- 従来の方法が指数的サイズの再書き換えを生じるのに対し、非再帰的 Datalog への再書き換えを多項式サイズに保てるかどうかを調査すること。
- このような多項式サイズの再書き換えが可能となる条件を、依存関係の構造的性質に焦点を当てて確立すること。
- 標準的な DBMS 技術を用いた効率的なクエリ評価の理論的基盤を提供すること。具体的には、知識ベースクエリを等価な非再帰的 Datalog プログラムにコンパイルすることにより実現する。
提案手法
- 関係の生成依存関係(tgds)の論理的帰結を模倣するために、チェイス手順(chase procedure)を活用する。
- クエリの含意が多項式ステップ数内で証明可能であることを保証する十分条件として、多項式的証拠性(Polynomial Witness Property, PWP)を導入する。
- PWP が保証する多項式バウンドまでにチェイスの導出をエンコードすることで、非再帰的 Datalog プログラムを構築する。
- ゴール述語を用いてクエリ結果を表現し、元のクエリが含意される場合にのみ、Datalog プログラムがゴールを導出することを保証する。
- グローバル順序が利用できない場合、述語のアリティを線形順序または対数的符号化を用いて制御する。
- 線形 tgds、スティッキー tgds、スティッキー結合 tgds などの特定の tgds クラスに対して、それらが PWP を満たすことを証明することで、本手法を適用する。
実験結果
リサーチクエスチョン
- RQ1DL-Lite や Linear Datalog ± における知識ベースクエリは、多項式サイズの非再帰的 Datalog プログラムに再書き換え可能か?
- RQ2関係の生成依存関係に、多項式サイズの再書き換えを保証する構造的性質は存在するか?
- RQ3チェイス手順を用いることで、指数的増大を伴わずに、このような再書き換えを効率的に構築可能か?
- RQ4役割包含を許容する形式的体系(例:スティッキー tgds やスティッキー結合 tgds)は、多項式サイズの非再帰的 Datalog 再書き換えを許容するか?
- RQ5得られる Datalog プログラムの最小アリティは何か?また、これは入力スキーマとクエリにどのように依存するか?
主な発見
- PWP を満たす任意の tgds クラスに対して、任意のブール型の連言的クエリは、クエリと T-Box のサイズの和に多項式的に比例するサイズの非再帰的 Datalog プログラムに再書き換え可能である。
- グローバル線形順序が利用可能な場合、得られる Datalog プログラムのアリティは max(a+1, 3) 以下である。ここで a はスキーマ内での最大述語アリティを表す。
- グローバル順序が利用できない場合、アリティは O(max(a+1, 3) · log m) で有界である。ここで m はクエリと T-Box のサイズの和を表す。
- 本手法は、線形 tgds、役割包含を許容する DL-Lite の変種、スティッキー tgds など、いくつかの重要な形式的体系に適用可能であり、これらすべてが PWP を満たすことが確認されている。
- 本手法の構成は多項式時間で実行可能であり、標準的な DBMS を用いたクエリ評価のための効率的な事前処理を可能にする。具体的には、SQL への翻訳による実装が可能である。
- 従来の研究を拡張し、役割包含公理が存在する場合でさえも、クエリサイズの指数的増大を回避する。これは、従来、指数的増大が生じると知られていたが、本研究ではその問題を解決している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。