Skip to main content
QUICK REVIEW

[論文レビュー] A More General Theory of Static Approximations for Conjunctive Queries

Pablo Barceló, Miguel Romero|arXiv (Cornell University)|Jan 1, 2018
Advanced Database Systems and Queries被引用数 3
ひとこと要約

本稿は、ハイパーグラフ分解における2つの長年の未解決問題を解決する。分数木幅(fhw)≤ k であるかどうかのチェック、および一般化木幅(ghw)≤ 2 であるかどうかのチェックが、ともにNP完全であることを証明し、数十年にわたる未解決の問いを解消した。著者らはさらに、有界多重交差性(BMIP)や有界交差性(BIP)といった、実用的で非自明な制限条件を同定し、fhwの対数要因内での多項式時間近似を可能にする。これにより、結合的クエリおよびCSP最適化のための実用的アルゴリズムが得られる。

ABSTRACT

Conjunctive query (CQ) evaluation is NP-complete, but becomes tractable for fragments of bounded hypertreewidth. If a CQ is hard to evaluate, it is thus useful to evaluate an approximation of it in such fragments. While underapproximations (i.e., those that return correct answers only) are well-understood, the dual notion of overapproximations that return complete (but not necessarily sound) answers, and also a more general notion of approximation based on the symmetric difference of query results, are almost unexplored. In fact, the decidability of the basic problems of evaluation, identification, and existence of those approximations, is open. We develop a connection with existential pebble game tools that allows the systematic study of such problems. In particular, we show that the evaluation and identification of overapproximations can be solved in polynomial time. We also make progress in the problem of existence of overapproximations, showing it to be decidable in 2EXPTIME over the class of acyclic CQs. Furthermore, we look at when overapproximations do not exist, suggesting that this can be alleviated by using a more liberal notion of overapproximation. We also show how to extend our tools to study symmetric difference approximations. We observe that such approximations properly extend under- and over-approximations, settle the complexity of its associated identification problem, and provide several results on existence and evaluation.

研究の動機と目的

  • 固定された k ≥ 2 に対して、fhw(H) ≤ k をチェックする問題が多項式時間で解けるかどうかという未解決問題を解消すること。
  • k ≥ 3 に対して既知の困難性が示されているものの、2006年以降も未解決のままであった、ghw(H) ≤ 2 の複雑性を解明すること。
  • 有界ghwやfhwの認識が多項式時間で可能となる、現実的で非自明なハイパーグラフ制限を同定すること。
  • 意味のある構造的制約下で、fhwのためのより良い近似比を達成する多項式時間近似アルゴリズムを開発すること。

提案手法

  • 3-SATから帰着し、制御されたエッジ交差を持つハイパーグラフの新規構成を用いて、fhw ≤ 2 および ghw ≤ 2 のチェックがNP完全であることを証明する。
  • fhw近似のトレーサビリティを保証する構造的制限として、有界多重交差性(BMIP)を導入する。
  • VC次元と分数エッジカバー双対性を活用し、ハイパーグラフの組合せ的性質を介して近似比を制限する。
  • BMIPが有界VC次元を意味することを確立し、これにより整数エッジカバー近似を用いてfhwを対数要因内に近似可能であることを示す。
  • 有界次数性(BDP)を用いて、Check(FHD,k) のトレーサビリティを保証し、BIPを用いてfhwの任意に近い多項式時間近似を可能にする。
  • ハイパーグラフ理論および制約充足問題の結果を応用し、構造的仮定の下での近似保証を導出する。

実験結果

リサーチクエスチョン

  • RQ1固定された k ≥ 2 に対して、fhw(H) ≤ k かどうかをチェックする問題はNP完全であるか?
  • RQ2ghw(H) ≤ 2 かどうかをチェックする問題は、 tractable かNP完全か?
  • RQ3ハイパーグラフに意味的で非自明な構造的制限を課すことで、有界ghw や fhw の認識が多項式時間で可能になるか?
  • RQ4現実的な制約下で、fhwのための多項式時間アルゴリズムが立方より良い近似比を達成できるか?
  • RQ5有界多重交差性(BMIP)は、fhwを対数要因内に多項式時間で近似可能にするか?

主な発見

  • k = 2 の場合、fhw(H) ≤ k をチェックすることはNP完全である。これは、データベース理論において13年間未解決だった問題を解決する。
  • ghw(H) ≤ 2 をチェックすることもNP完全である。2006年以来未解決のままだったギャップを埋めた。
  • 有界多重交差性(BMIP)により、fhwをO(k · log k)の要因内に多項式時間で近似可能なアルゴリズムが可能になる。
  • 有界交差性(BIP)により、fhwを任意に近い多項式時間で近似可能になる。
  • 有界次数性(BDP)により、Check(FHD,k) 問題のトレーサビリティが保証される。
  • VC次元が有界であるハイパーグラフ(たとえばBMIPを満たすもの)は、分数木幅の効率的近似が可能になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。