Skip to main content
QUICK REVIEW

[論文レビュー] Finding Smallest Witnesses for Conjunctive Queries

Xiao Hu, Stavros Sintos|arXiv (Cornell University)|Nov 30, 2023
Data Management and Algorithms被引用数 1
ひとこと要約

この論文は、自己結合を含まない連言的クエリ(CQs)における最小の証拠問題(SWP)を研究し、二分法を確立する:SWPは、クエリがヘッドクラスタ性を有する場合にかつその場合に限り、多項式時間で解ける。近似に関しては、ヘッドドミナント性が鍵となる性質であると特定する。ヘッドドミナント性を有するクエリは定数倍近似が可能であるが、そうでないクエリはP = NPでない限り対数的要因内での近似が不可能である。さらに、特定のCQクラスに対して近似アルゴリズムを提供し、包括的なグリーディおよび還元ベースの手法を含む。強力な近似不能性の下界も確立する。

ABSTRACT

A witness is a sub-database that preserves the query results of the original database but of much smaller size. It has wide applications in query rewriting and debugging, query explanation, IoT analytics, multi-layer network routing, etc. In this paper, we study the smallest witness problem (SWP) for the class of conjunctive queries (CQs) without self-joins. We first establish the dichotomy that SWP for a CQ can be computed in polynomial time if and only if it has head-cluster property, unless P = NP. We next turn to the approximated version by relaxing the size of a witness from being minimum. We surprisingly find that the head-domination property - that has been identified for the deletion propagation problem [Kimelfeld et al., 2012] - can also precisely capture the hardness of the approximated smallest witness problem. In polynomial time, SWP for any CQ with head-domination property can be approximated within a constant factor, while SWP for any CQ without such a property cannot be approximated within a logarithmic factor, unless P = NP. We further explore efficient approximation algorithms for CQs without head-domination property: (1) we show a trivial algorithm which achieves a polynomially large approximation ratio for general CQs; (2) for any CQ with only one non-output attribute, such as star CQs, we show a greedy algorithm with a logarithmic approximation ratio; (3) for line CQs, which contain at least two non-output attributes, we relate SWP problem to the directed steiner forest problem, whose algorithms can be applied to line CQs directly. Meanwhile, we establish a much higher lower bound, exponentially larger than the logarithmic lower bound obtained above. It remains open to close the gap between the lower and upper bound of the approximated SWP for CQs without head-domination property.

研究の動機と目的

  • 自己結合を含まない連言的クエリにおける最小の証拠を計算するための正確な tractability の境界を特定すること。
  • ヘッドドミナント性を用いた最小の証拠問題の近似可能性を特徴づけること。
  • ヘッドドミナント性を欠くCQに対して、特にスターやラインCQに対して効率的な近似アルゴリズムを開発すること。
  • ヘッドドミナント性を欠くCQにおける近似可能なSWP問題のタイトな近似不能性下界を確立すること。
  • SWPと、有向ステーナー木問題や部分集合被覆問題などの他の基本的問題との関係を調査すること。

提案手法

  • 二分法の証明:P ≠ NPを仮定して、SWPはPに属する iff クエリがヘッドクラスタ性を有する。
  • 近似可能性の正確な特徴づけとしてヘッドドミナント性を導入する:定数倍近似が可能である iff ヘッドドミナント性が成立する。
  • 一般のCQに対して多項式近似比を有する自明な近似アルゴリズムを提案する。
  • 1つの非出力属性しか持たないCQ(例:スターキューエリ)に対して、対数的近似比を達成するグリーディアルゴリズムを設計する。
  • ラインCQのSWPを有向ステーナー木(DSF)問題に還元し、既存のDSFアルゴリズムの適用を可能にする。
  • ラベルカバー問題からの直接還元により、スーパーポリノミアルな近似不能性下界を確立し、ラインCQのSWPに対してΩ(2(log N)^{1−ϵ})の近似不能性を示す。

実験結果

リサーチクエスチョン

  • RQ1連言的クエリの最小の証拠問題(SWP)が多項式時間で解けるのはいつか?
  • RQ2連言的クエリのどの構造的性質が、SWPが定数倍近似可能かどうかを決定するか?
  • RQ3ヘッドドミナント性を欠くCQに対して、効率的な近似アルゴリズムを設計できるか?
  • RQ4ヘッドドミナント性を欠くCQにおけるSWPの最も強い可能なかつての近似不能性下界は何か?
  • RQ5SWPは、有向ステーナー木問題や部分集合被覆問題などの他の基本的問題とどのように関係するか?

主な発見

  • 自己結合を含まない連言的クエリのSWPは、P ≠ NPを仮定すると、ヘッドクラスタ性を有する場合にかつその場合に限り、多項式時間で解ける。
  • ヘッドドミナント性はSWPの近似可能性を正確に特徴づける:定数倍近似が可能である iff ヘッドドミナント性が成立する。
  • ヘッドドミナント性を欠くCQに対しては、P = NPでない限り、多項式時間アルゴリズムが対数的近似比を達成することは不可能である。
  • グリーディアルゴリズムは、スターキューエリのような1つの非出力属性しか持たないCQに対して、対数的近似比を達成する。
  • ラインCQでは、SWPを有向ステーナー木問題に還元でき、O(min{|Q(D)|^{1/2+o(1)}, dom^{0.5778}, N^{1/2}})の近似が可能になる。
  • P ≠ NPを仮定すると、ラインCQにおけるSWPに対して、指数的近似不能性下界Ω(2(log N)^{1−ϵ})が確立された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。