[논문 리뷰] Database Theory in Action: Cypher, GQL, and Regular Path Queries
이 논문은 GQL과 SQL/PGQ가 공유하는 핵심 쿼리 언어 표준인 GPML(Graph Pattern Matching Language)을 제안하며, SQL 및 네이티브 그래프 데이터베이스 간의 속성 그래프 쿼리 방식을 통합한다. GPML은 변수를 활용한 경로 패턴 매칭, 경로 바인딩, 다중성 인식 집계를 정형화하여 산업계 및 학계 시스템 간 일관되고 표준화된 그래프 패턴 매칭을 가능하게 한다.
As graph databases become widespread, JTC1 -- the committee in joint charge of information technology standards for the International Organization for Standardization (ISO), and International Electrotechnical Commission (IEC) -- has approved a project to create GQL, a standard property graph query language. This complements a project to extend SQL with a new part, SQL/PGQ, which specifies how to define graph views over an SQL tabular schema, and to run read-only queries against them. Both projects have been assigned to the ISO/IEC JTC1 SC32 working group for Database Languages, WG3, which continues to maintain and enhance SQL as a whole. This common responsibility helps enforce a policy that the identical core of both PGQ and GQL is a graph pattern matching sub-language, here termed GPML. The WG3 design process is also analyzed by an academic working group, part of the Linked Data Benchmark Council (LDBC), whose task is to produce a formal semantics of these graph data languages, which complements their standard specifications. This paper, written by members of WG3 and LDBC, presents the key elements of the GPML of SQL/PGQ and GQL in advance of the publication of these new standards.
연구 동기 및 목표
- GQL과 SQL/PGQ 모두를 위한 공통의 표준화된 그래프 패턴 매칭 언어(GPML)를 정의하여 속성 그래프 시스템 간 상호운용성을 보장한다.
- GPML의 의미론을 정형화하여 다양한 구현 간 정확하고 일관된 쿼리 평가를 지원한다.
- ISO/IEC JTC1 SC32 WG3에서 유래한 공유된 설계 원칙을 활용하여 GQL과 SQL/PGQ의 핵심 쿼리 언어를 하나의 사양으로 통합한다.
- 속성 그래프 데이터베이스의 광범위한 도입에도 불구하고 표준 속성 그래프 쿼리 언어의 부재를 해결한다.
- 실제 산업 현장의 그래프 워크로드를 지원하기 위해 Cypher와 PGQL 등의 산업 언어에서 유래한 기능들인 경로 바인딩, 집계, 사이클 처리 기능을 통합한다.
제안 방법
- GQL과 SQL/PGQ의 공통 하위언어로 GPML을 정의하며, 경로 변수와 다중성 민감 집계를 추가한 연속 정규 경로 쿼리(CRPQs) 기반으로 한다.
- 노드와 에지에 대한 변수 바인딩을 사용한 경로 패턴 매칭을 정형화하며, 경로 수준 변수 및 속성 접근 기능을 지원한다.
- 세밀한 매칭 의미론을 도입하여 다양한 경로 바인딩을 구분하고, 경로 제한자(예: 단순 경로, 트레일)를 통한 필터링을 지원한다.
- Cypher, PGQL, GSQL 등의 기존 산업 쿼리 언어를 설계 기초로 삼되, 제조사에 종속된 문법은 추상화한다.
- LDBC 학술 워킹 그룹을 활용하여 표준 사양을 보완하는 형식적 의미론을 개발한다.
- GQL과 SQL/PGQ에서 동일한 패턴에 대해 동일한 평가 동작을 보장하기 위해 핵심 GPML 엔진 논리를 통합한다.
실험 결과
연구 질문
- RQ1GQL과 SQL/PGQ를 통합하면서도 각각의 고유한 사용 사례를 유지할 수 있는 공통 그래프 패턴 매칭 언어를 어떻게 설계할 수 있는가?
- RQ2다양한 시스템 간 경로 패턴의 일관되고 예측 가능한 평가를 보장하기 위해 필요한 형식적 의미론은 무엇인가?
- RQ3경로 제한자(예: 단순 경로, 트레일)는 그래프 쿼리의 계산 복잡도와 실용적 사용성에 어떤 영향을 미치는가?
- RQ4기존 산업 언어(예: Cypher, PGQL)에서 GPML에 포함시켜야 할 핵심 기능은 무엇인가?
- RQ5경로 수준 변수와 경로 기반 집계는 표준화된 쿼리 언어에 어떻게 정형화하고 통합할 수 있는가?
주요 결과
- GPML은 GQL과 SQL/PGQ의 공통 핵심으로 정형화되어 있으며, 두 표준 간 동일한 경로 패턴 평가를 보장한다.
- GPML은 경로 변수와 다중성 인식 집계(예: count, sum, average)를 지원하여 기존 CRPQ보다 더 표현력 있고 의미론적으로 정확한 쿼리를 가능하게 한다.
- '단순 경로' 및 '트레일'과 같은 경로 제한자는 형식적 의미론을 재정의하여 이전에 지적된 높은 계산 복잡도 문제를 철저한 설계로 해결한다.
- LDBC 학술 그룹이 개발한 형식적 의미론은 GQL과 SQL/PGQ의 규범적 사양을 보완하는 엄밀한 기반을 제공한다.
- GPML이 두 표준에 통합되어 동일한 쿼리는 네이티브 그래프 데이터베이스(GQL)에서 실행되든 SQL 기반 그래프 뷰(SQL/PGQ)에서 실행되든 동일한 결과를 산출함을 보장한다.
- 표현력과 성능 사이의 균형을 성공적으로 확보하여 복잡한 그래프 패턴을 지원하면서도 제어된 경로 순회 방식을 통해 비종료 문제를 방지한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.