Skip to main content
QUICK REVIEW

[論文レビュー] Answering Conjunctive Queries with Inequalities

Paraschos Koutris, Tova Milo|arXiv (Cornell University)|Dec 12, 2014
Complexity and Algorithms in Graphs被引用数 3
ひとこと要約

本稿では、任意の既存のSPJクエリプランを用いて、クエリ依存のオーバーヘッドのみで、多項式時間内に不等式(≠)を含む連言的クエリ(CQ)を評価する、新しいH射影演算子とクエリプランベースの技術を導入する。主な貢献は、クエリの分数頂点被覆が有界である場合に多項式時間の結合複雑度を保証する一般化された手法であり、整数頂点被覆が無限大である場合にはNP困難であることを特定することにある。

ABSTRACT

In this parer, we study the complexity of answering conjunctive queries (CQ) with inequalities. In particular, we compare the complexity of the query with and without inequalities. The main contribution of our work is a novel combinatorial technique that enables the use of any Select-Project-Join query plan for a given CQ without inequalities in answering the CQ with inequalities, with an additional factor in running time that only depends on the query. To achieve this, we define a new projection operator that keeps a small representation (independent of the size of the database) of the set of input tuples that map to each tuple in the output of the projection; this representation is used to evaluate all the inequalities in the query. Second, we generalize a result by Papadimitriou-Yannakakis [PODS'97] and give an alternative algorithm based on the color-coding technique [Alon, Yuster and Zwick, PODS'02] to evaluate a CQ with inequalities by using an algorithm for the CQ without inequalities. Third, we investigate the structure of the query graph, inequality graph, and the augmented query graph with inequalities, and show that even if the query and the inequality graphs have bounded treewidth, the augmented graph not only can have an unbounded treewidth but can also be NP-hard to evaluate. Further, we illustrate classes of queries and inequalities where the augmented graphs have unbounded treewidth, but the CQ with inequalities can be evaluated in poly-time. Finally, we give necessary properties and sufficient properties that allow a class of CQs to have poly-time combined complexity with respect to any inequality pattern.

研究の動機と目的

  • 不等式が連言的クエリ(CQ)に追加されると、結合複雑度が多項式からNP困難にまで上昇するという顕著な複雑度の増加に対処すること。
  • 不等式のないCQ用の既存の選択・投影・結合(SPJ)クエリプランを、クエリ依存の時間的オーバーヘッドのみで不等式を含むCQに適応する一般化された技術を開発すること。
  • 構造的性質(クエリおよび不等式グラフの性質)に基づいて、不等式を含むCQのクラスを、多項式時間の結合複雑度を有するものとNP困難なものに分類すること。
  • 不等式を含むCQが効率的に評価可能であるための必要十分条件を同定すること、特にクエリグラフにおける分数および整数頂点被覆に焦点を当てる。
  • 提案手法のクエリプランベースのアプローチを、カラーコーディングや代表集合といった代替手法と比較し、特定のケースで優れた性能を示すことを示すこと。

提案手法

  • 入力タプルから出力タプルへのマッピングを、サイズに依存しないコンパクトな表現で維持する新しいH射影演算子を導入し、不等式評価を効率的に行えるようにする。
  • 不等式のないCQ用の任意のSPJクエリプランを、H射影による投影ステップの拡張によって、不等式を含む同じCQを評価できるように変換する。
  • 二重のアプローチを採用:制限付きのオーバーヘッドを持つクエリプランベースの手法と、固定パrameter可 tractable(FPT)なケースに適したカラーコーディングベースのアルゴリズム。
  • 最小分数エッジ被覆と最大分数頂点被覆の双対性を用いて、後者が有界である場合に多項式時間での評価が可能であることを導出する。
  • 代表集合やカラーコーディングなどの組合せ的技術を用い、特に有界なツイードウまたは非巡回構造を有するケースにおいて、不等式を含むCQを評価する。
  • 拡張クエリグラフ(クエリ+不等式)を分析し、元のクエリグラフおよび不等式グラフが両方とも有界なツイードウを持つ場合でも、拡張グラフは無限大のツイードウを有し、評価がNP困難である可能性があることを示す。

実験結果

リサーチクエスチョン

  • RQ1不等式のないCQ用の任意のSPJクエリプランは、クエリ依存の時間増加のみで、同じCQに不等式を含む場合に適応可能か?
  • RQ2CQおよびその不等式パターンの構造的性質が、結合複雑度が多項式のままであるかどうかを決定づけるか?
  • RQ3不等式を含むCQのクラスについて、多項式時間で解けるものとNP困難なものに分ける二分法的特徴づけ(dichotomy)や同定が可能か?
  • RQ4クエリグラフ、不等式グラフ、および拡張グラフのツイードウは、不等式を含むクエリ評価の複雑度とどのように関係するか?
  • RQ5提案されたH射影技術は、特定のクエリクラスにおいて、従来の手法(例:カラーコーディングや代表集合)を実用的に上回る性能を示せるか?

主な発見

  • 主な結果として、不等式のないCQ用の任意のSPJクエリプランは、クエリおよび不等式パターンにのみ依存する関数g(q, I)で制限される時間増加のみで、不等式を含む同じCQに適応可能であることが確立された。
  • H射影演算子により、データベースサイズに依存しない、出力タプルごとの入力タプルのコンパクトな表現が維持され、不等式評価が効率的に行える。
  • 整数頂点被覆が無限大であるブールCQの族がある場合、(q, I)の結合複雑度はNP困難であることが、3-彩色問題への還元により示された。
  • 分数頂点被覆が有界であるCQの族がある場合、任意の不等式パターンに対して(q, I)は多項式時間の結合複雑度で評価可能であり、分数エッジ被覆と頂点被覆の双対性を活用している。
  • クエリグラフおよび不等式グラフが個別に有界なツイードウを持つ場合でも、拡張グラフ(クエリ+不等式)は無限大のツイードウを有し、評価がNP困難である可能性がある。これは、ツイードウのみでは可 tractability を保証できないことを示している。
  • 提案されたクエリプランベースの手法は、分数頂点被覆が有界であるケースにおいて、カラーコーディングなどの代替手法を下回る、より低い漸近的オーバーヘッドを有するため、実用的に優れた性能を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。