Skip to main content
QUICK REVIEW

[논문 리뷰] Combined Tractability of Query Evaluation via Tree Automata and Cycluits

Antoine Amarilli, Pierre Bourhis|arXiv (Cornell University)|2016. 12. 13.
Advanced Graph Theory Research참고 문헌 14인용 수 2
한 줄 요약

이 논문은 계층적 부정을 갖는 Datalog의 한 분할인 intensional-clique-guarded Datalog (ICG-Datalog)을 제안한다. 이는 규칙 크기를 매개변수로 삼아 트리폭이 유계인 데이터베이스에서 고정매개변수능선적(FPT)-선형 평가를 가능하게 하며, 이는 쿼리를 교호적 양방향 트리 온톨로지로 컴파일하고, 계층적 의미를 가진 순환 증명 회로(cycluits)를 사용해 효율적인 평가를 가능하게 한다. 또한 이 매개변수화 조건 하에서도 확률적 쿼리 평가가 여전히 비효율적임을 보여준다.

ABSTRACT

Several query evaluation tasks can be done via knowledge compilation: the query result is compiled as a lineage circuit from which the answer can be determined. For such tasks, it is important to leverage some width parameters of the circuit, such as bounded treewidth or pathwidth, to convert the circuit to structured classes, e.g., deterministic structured NNFs (d-SDNNFs) or OBDDs. In this work, we show how to connect the width of circuits to the size of their structured representation, through upper and lower bounds. For the upper bound, we show how bounded-treewidth circuits can be converted to a d-SDNNF, in time linear in the circuit size. Our bound, unlike existing results, is constructive and only singly exponential in the treewidth. We show a related lower bound on monotone DNF or CNF formulas, assuming a constant bound on the arity (size of clauses) and degree (number of occurrences of each variable). Specifically, any d-SDNNF (resp., SDNNF) for such a DNF (resp., CNF) must be of exponential size in its treewidth; and the same holds for pathwidth when compiling to OBDDs. Our lower bounds, in contrast with most previous work, apply to any formula of this class, not just a well-chosen family. Hence, for our language of DNF and CNF, pathwidth and treewidth respectively characterize the efficiency of compiling to OBDDs and (d-)SDNNFs, that is, compilation is singly exponential in the width parameter. We conclude by applying our lower bound results to the task of query evaluation.

연구 동기 및 목표

  • 결합된 쿼리 평가가 고정매개변수능선적(fixed-parameter tractable)이 되는 쿼리와 데이터베이스의 매개변수화된 클래스를 규명하는 것.
  • 트리형(유계 트리폭) 데이터베이스에서 쿼리 평가의 타당한 결합 복잡도에 대한 격차를 메우는 것.
  • 자동화 및 증명 추적을 통해 효율적인 평가를 가능하게 하는 컴파일 프레임워크를 개발하는 것.
  • 제안된 매개변수화 조건 하에서도 확률적 쿼리 평가가 여전히 비효율적임을 보여주는 것.
  • 두 방향 정규 경로 쿼리와 α-비순환 결합 쿼리와 같은 쿼리 클래스의 타당성을 형식화하고, 클리크가 보호된 조건 하에서 트리폭이 유계인 조건에서 증명하는 것.

제안 방법

  • 계층적 부정, 클리크 가드, 그리고 비내림차순 고정점(fixpoints)을 갖는 ICG-Datalog를 제안한다.
  • 트리형 인스턴스에서의 효율적 평가를 위해 ICG-Datalog 프로그램을 교호적 양방향 트리 온톨로지로 컴파일한다.
  • 자동화 증명을 선형 시간 내에 표현하고 평가할 수 있도록 계층적 의미를 가진 순환 증명 회로(cycluits)를 도입한다.
  • 타당성의 구조적 매개변수로 클리크 가드가 있는 트리 분해(simplistic decompositions)를 사용한다.
  • 순환 증명 회로를 통한 새로운 운영 의미 체계를 도입하여 재귀와 양방향 이동을 처리한다.
  • 자동화의 공집합 테스트로 쿼리 평가를 환원하며, 유계 트리폭 인스턴스의 트리형 모델 성질을 활용한다.

실험 결과

연구 질문

  • RQ1트리폭이 유계인 데이터베이스에서 쿼리 평가의 고정매개변수능선적(FPT)-선형 결합 복잡도를 달성할 수 있는가?
  • RQ2α-비순환 결합 쿼리와 두 방향 정규 경로 쿼리와 같은 타당한 쿼리 클래스를 포함하는 Datalog 분할을 정의할 수 있는가?
  • RQ3자동화 기반 쿼리 컴파일에서 재귀와 양방향 이동을 효율적으로 처리할 수 있는 증명 표현이 존재하는가?
  • RQ4계층적 순환 회로인 cycluits는 선형 시간 내에 평가 가능하며, 부울 회로나 공식과의 대안으로 유용한가?
  • RQ5제안된 매개변수화 조건 하에서도 확률적 쿼리 평가의 타당성이 유지되는가?

주요 결과

  • ICG-Datalog는 규칙 크기를 매개변수로 삼아 트리폭이 유계인 데이터베이스에서 FPT-선형 결합 복잡도를 달성한다.
  • 이 언어는 α-비순환 결합 쿼리, 유계 CQ-랭크를 갖는 가드된 부정 분할 쿼리, 두 방향 정규 경로 쿼리를 모두 포함한다.
  • Cycluits는 교호적 양방향 자동화의 증명을 선형 시간 내에 평가할 수 있게 하며, 재귀와 이중 방향 이동을 다룰 때 전통적인 공식이나 회로보다 뛰어난 성능을 보인다.
  • 트리폭이 유계인 쿼리만으로는 자동화로의 컴파일이 효율적이지 않으며, 하한선을 통해 클리크 가드가 없이 트리폭만으로는 부족함을 입증한다.
  • 확률적 쿼리 평가가 제안된 매개변수화 조건 하에서도 여전히 결합 복잡도에서 비효율적임을 보였다.
  • 단항 Datalog의 포함성 문제가 유계 트리폭 결합 쿼리에서 2EXPTIME-난이도임을 입증하였으며, 이는 일반적인 상한선과 일치한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.