Skip to main content
QUICK REVIEW

[論文レビュー] Distribution Policies for Datalog

Bas Ketsman, Aws Albarghouthi|arXiv (Cornell University)|Jan 1, 2016
Advanced Database Systems and Queries被引用数 1
ひとこと要約

この論文は、分散Datalog評価における並列正しさの分析を、結合的選言的クエリ(UCQ)および否定を含む結合的クエリ(CQ¬)へと拡張し、UCQでは並列正しさがΠP₂に留まる一方、CQ¬では指数的に大きな反例が必要なため、coNEXPTIME完全性に上昇することを示している。主な貢献は、CQ¬包含問題がcoNEXPTIME完全性であることを証明したことであり、従来の有界なアリティ下でのΠP₂完全性の仮定に反するものである。

ABSTRACT

Modern data management systems extensively use parallelism to speed up query processing over massive volumes of data. This trend has inspired a rich line of research on how to formally reason about the parallel complexity of join computation. In this paper, we go beyond joins and study the parallel evaluation of recursive queries. We introduce a novel framework to reason about multi-round evaluation of Datalog programs, which combines implicit predicate restriction with distribution policies to allow expressing a combination of data-parallel and query-parallel evaluation strategies. Using our framework, we reason about key properties of distributed Datalog evaluation, including parallel-correctness of the evaluation strategy, disjointness of the computation effort, and bounds on the number of communication rounds.

研究の動機と目的

  • 並列正しさの理論を、結合的選言的クエリ(UCQ)および否定を含む結合的クエリ(CQ¬)の分散クエリ評価に拡張すること。
  • UCQおよびCQ¬に対する分布ポリシー下での並列正しさ、並列整合性、並列完全性の複雑性を調査すること。
  • CQ¬の包含問題が、従来の予想よりも難しいかどうか、特に一般スキーマ下で検証すること。
  • 固定スキーマや有界アリティなどの条件下で、CQ¬の並列正しさの高複雑性がどのように低下するかを特定すること。
  • 新しい複雑性境界と還元を提供し、包含問題から並列正しさへの下界の転送を可能にすること。

提案手法

  • CQsからUCQsへの価値割り当てに基づく並列正しさの特徴付けを拡張し、並列正しさがΠP₂に留まることを示した。
  • CQ¬の反例ベースのアルゴリズムを導入し、指数的に大きな反例に依存してcoNEXPTIMEの上界を確立した。
  • CQ¬包含問題から並列正しさ(およびその変種)への還元を用い、coNEXPTIME困難性を証明した。
  • クエリ包含問題から並列正しさへの新規還元を用い、CQ¬包含問題がcoNEXPTIME完全であることを示した。
  • 否定を含む完全結合的クエリ(FCQ¬)を分析し、完全性制約下では並列正しさがcoNP完全に低下することを示した。
  • 同様の還元技術を用いて、否定を含む完全結合的クエリの和集合(UFCQ¬)の複雑性境界を導出し、coNP完全性を確立した。

実験結果

リサーチクエスチョン

  • RQ1任意の分布ポリシー下での結合的選言的クエリ(UCQ)の並列正しさの複雑性は何か?
  • RQ2否定の存在が並列正しさの複雑性に与える影響は何か。また、価値割り当てによる特徴付けは依然可能か?
  • RQ3否定を含む結合的クエリ(CQ¬)の包含問題は、従来の予想よりも難しいとされるべきか。特にアリティの上限がない場合にそうか?
  • RQ4固定スキーマや有界アリティなどの条件下で、CQ¬の並列正しさの複雑性はcoNEXPTIME未満に低下するか?
  • RQ5CQ¬の包含問題は並列正しさに還元可能か。これにより複雑性境界にどのような含意が生じるか?

主な発見

  • 結合的選言的クエリ(UCQ)の並列正しさはΠP₂に留まり、CQsからの価値割り当て特徴付けが拡張された。
  • 否定を含む結合的クエリ(CQ¬)の並列正しさは、指数的に大きな反例が必要なためcoNEXPTIME完全である。
  • CQ¬の包含問題はcoNEXPTIME完全である。これは、一般スキーマ下での従来のΠP₂完全性の仮定に反する。
  • データベーススキーマが固定されているか、関係のアリティが有界である場合、CQ¬の並列正しさはΠP₂に低下する。
  • 否定を含む完全結合的クエリの和集合(UFCQ¬)の並列正しさはcoNP完全であり、複雑性が著しく低下する。
  • 本論文は、CQ¬の包含問題から並列正しさへの新規還元を確立し、下界の転送を可能にした。これにより、包含問題のcoNEXPTIME完全性が証明された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。