Skip to main content
QUICK REVIEW

[논문 리뷰] Rewriting Ontological Queries into Small Nonrecursive Datalog Programs

Georg Gottlob, Thomas Schwentick|arXiv (Cornell University)|2011. 06. 19.
Logic, Reasoning, and Knowledge참고 문헌 31인용 수 77
한 줄 요약

이 논문은 DL-Lite 또는 Linear Datalog ±로 표현된 온톨로지 쿼리를 다항시간에 작은 비재귀적 Datalog 프로그램으로 재작성하는 방법을 제시한다. 이는 쿼리 크기의 지수적 증가를 피하는 데 목적이 있다. 주요 기여는 이러한 재작성이 존재하고, 기반 토퍼르 생성 종속성(underlying tuple-generating dependencies)이 다항 증거 성질(Polynomial Witness Property)을 만족할 경우 효율적으로 구성될 수 있음을 증명하는 것이다.

ABSTRACT

We consider the setting of ontological database access, where an Abox is given in form of a relational database D and where a Boolean conjunctive query q has to be evaluated against D modulo a Tbox T formulated in DL-Lite or Linear Datalog+/-. It is well-known that (T,q) can be rewritten into an equivalent nonrecursive Datalog program P that can be directly evaluated over D. However, for Linear Datalog? or for DL-Lite versions that allow for role inclusion, the rewriting methods described so far result in a nonrecursive Datalog program P of size exponential in the joint size of T and q. This gives rise to the interesting question of whether such a rewriting necessarily needs to be of exponential size. In this paper we show that it is actually possible to translate (T,q) into a polynomially sized equivalent nonrecursive Datalog program P.

연구 동기 및 목표

  • DL-Lite 또는 Linear Datalog ±를 사용할 경우 역할 포함(role inclusion)이 있을 때 쿼리 재작성에서 지수적 증가 문제를 해결한다.
  • 기존 방법에서처럼 지수적 크기로 증가하지 않고, 비재귀적 Datalog로의 쿼리 재작성이 다항 크기로 유지될 수 있는지 조사한다.
  • 다항 크기의 재작성이 가능한 조건을 설정하며, 종속성의 구조적 성질에 초점을 맞춘다.
  • 표준 DBMS 기술을 사용한 효율적 쿼리 평가를 위한 이론적 기반을 마련하기 위해, 온톨로지 쿼리를 등가의 비재귀적 Datalog 프로그램으로 컴파일하는 방법을 제공한다.

제안 방법

  • 관계 데이터베이스 위에서 토퍼르 생성 종속성(tgds)의 논리적 결과를 시뮬레이션하기 위해 채이스 절차를 활용한다.
  • 쿼리 함의가 다항 수의 채이스 단계 내에서 증거될 수 있도록 보장하기 위한 충분조건으로 다항 증거 성질(Polynomial Witness Property, PWP)을 도입한다.
  • PWP가 보장하는 다항 한계 이내의 채이스 유도 과정을 Datalog 규칙으로 인코딩하여 비재귀적 Datalog 프로그램을 구성한다.
  • 목표 술어(goal predicate)를 도입하여, Datalog 프로그램이 목표를 도출하는 것과 원래 쿼리가 함의되는 것이 정확히 일치하도록 보장한다.
  • 전역 순서가 없을 경우, 선형 순서 또는 로그적 인코딩을 사용하여 Datalog 술어의 아리티를 제어한다.
  • 선형 tgds, 스티키 tgds, 스티키-조인 tgds 등의 특정 tgds 클래스에 대해, 이들이 PWP를 만족함을 증명함으로써 방법을 적용한다.

실험 결과

연구 질문

  • RQ1DL-Lite 또는 Linear Datalog ±의 온톨로지 쿼리는 비재귀적 Datalog 프로그램으로 다항 크기로 재작성될 수 있는가?
  • RQ2다항 크기의 재작성을 보장하는 토퍼르 생성 종속성의 구조적 성질이 존재하는가?
  • RQ3채이스 절차를 사용하여 이러한 재작성을 지수적 증가 없이 효율적으로 구성할 수 있는가?
  • RQ4역할 포함을 允허하는 스티키 tgds 및 스티키-조인 tgds와 같은 형식 체계는 다항 크기의 비재귀적 Datalog 재작성을 허용하는가?
  • RQ5결과 Datalog 프로그램의 최소 아리티는 얼마이며, 이는 입력 스키마와 쿼리에 어떻게 의존하는가?

주요 결과

  • 다항 증거 성질(Polynomial Witness Property, PWP)을 만족하는 모든 tgds 클래스에 대해, 임의의 부울 형태의 조건부 쿼리는 쿼리와 T-박스의 공동 크기의 다항식 크기로 비재귀적 Datalog 프로그램으로 재작성될 수 있다.
  • 전역 선형 순서가 존재할 경우, 결과 Datalog 프로그램의 아리티는 최대 max(a+1, 3) 이하이며, 여기서 a는 스키마 내 최대 술어 아리티이다.
  • 전역 순서가 없을 경우, 아리티는 O(max(a+1, 3) · log m) 이하로 제한되며, 여기서 m은 쿼리와 T-박스의 공동 크기이다.
  • 이 방법은 선형 tgds, 역할 포함을 허용하는 DL-Lite 변형, 스티키 tgds 등 여러 중요한 형식 체계에 적용 가능하며, 이들 모두 PWP를 만족한다.
  • 이론적 구성은 다항 시간 내에 수행되며, SQL 번역을 통해 표준 DBMS를 통한 쿼리 평가에 대한 효율적 사전처리를 가능하게 한다.
  • 기존 연구를 확장하여, 이전에 지수적 증가를 야기하는 것으로 알려진 역할 포함 공리가 존재하더라도 쿼리 크기의 지수적 증가를 피할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.