QUICK REVIEW

[논문 리뷰] Deep Learning for Ontology Reasoning

Patrick Hohenecker, Thomas Lukasiewicz|arXiv (Cornell University)|2017. 05. 29.

Semantic Web and Ontologies참고 문헌 7인용 수 30

한 줄 요약

이 논문은 깊이 학습 기반 접근 방식을 제안하며, 재귀 신경망(RTN) 모델을 사용하여 온톨로지 추론을 수행한다. 이는 전통적인 논리 기반 추론기인 RDFox와 비교해 최대 100배 빠른 속도를 기록하면서도 높은 추론 정확도를 달성한다. 이 방법은 엔티티와 관계에 대한 분포형 임베딩을 학습함으로써 GPU에서의 벡터 공간 계산을 통해 대규모 온톨로지 지식 기반에서 효율적인 추론을 가능하게 한다.

ABSTRACT

In this work, we present a novel approach to ontology reasoning that is based on deep learning rather than logic-based formal reasoning. To this end, we introduce a new model for statistical relational learning that is built upon deep recursive neural networks, and give experimental evidence that it can easily compete with, or even outperform, existing logic-based reasoners on the task of ontology reasoning. More precisely, we compared our implemented system with one of the best logic-based ontology reasoners at present, RDFox, on a number of large standard benchmark datasets, and found that our system attained high reasoning quality, while being up to two orders of magnitude faster.

연구 동기 및 목표

심볼릭 논리 기반 온톨로지 추론의 확장성과 내성 문제를 깊이 학습을 활용해 해결하고자 한다.
기존의 형식적 추론기보다 불완전하거나 모순되거나 불확실한 데이터를 더 효과적으로 다룰 수 있는 통계적 관계 학습 모델을 개발하고자 한다.
고정밀 추론 정확도를 유지하면서도 깊이 신경망을 사용해 빠르고 확장 가능한 온톨로지 추론을 가능하게 하고자 한다.
제안된 방법이 대규모 실세계 지식 기반 벤치마크에서 최첨단 논리 기반 추론기들과 비교하여 평가되도록 하고자 한다.

제안 방법

이 방법은 온톨로지 지식 기반 내의 엔티티와 관계에 대해 분포형 벡터 임베딩을 학습하기 위해 재귀 신경망(RTN)을 활용한다.
RTN은 논리적 표현을 트리 구조의 계산 그래프로 처리하며, 하위 표현의 표현을 재귀적으로 통합하여 고차원 임베딩을 형성한다.
추론은 임베딩 벡터 간의 유사도 점수를 계산하여 수행되며, 이는 기호 데이터 위에서의 엔드 투 엔드 미분 가능 추론을 가능하게 한다.
모델은 전체 지식 기반을 대상으로 학습하는 것이 아니라 온톨로지 자체에서만 학습되므로, 시스템 설정 단계로 사전 학습이 가능하다.
추론은 논리 기반 시스템의 기호적 추론과 대비해 GPU에서 효율적인 벡터 연산을 통해 수행된다.
이 프레임워크는 통합된 임베딩 공간에서 단항(클래스 소속) 및 이항(관계) 술어 추론을 모두 지원한다.

실험 결과

연구 질문

RQ1재귀 신경망 기반 깊이 학습 모델이 대규모 온톨로지 지식 기반에서 논리 기반 추론기와 유사한 추론 성능을 달성할 수 있는가?
RQ2RDFox와 같은 최첨단 논리 기반 추론기와 비교해 제안된 방법의 추론 속도는 어떻게 스케일링되는가?
RQ3학습된 임베딩가 표현력 있는 온톨로지에서 복잡한 논리적 관계의 의미를 어느 정도 정확히 포착할 수 있는가?
RQ4실세계 데이터셋에서 클래스와 관계의 불균형이 존재하더라도 모델이 높은 정확도를 유지할 수 있는가?

주요 결과

제안된 NeTS 시스템은 Claros 데이터셋에서 평균 F1 점수 0.954, DBpedia에서 0.959, LUBM에서 0.948, OUBM에서 0.953을 기록하여 뛰어난 추론 정확도를 입증했다.
네 가지 벤치마크 데이터셋 전반에서 단항 술어에 대해 평균 정확도가 96% 이상, 이항 술어에 대해선 95% 이상을 기록하여 뛰어난 내성 성능을 입증했다.
모든 데이터셋에서 NeTS는 RDFox 대비 최대 100배 빠른 속도로 자료 물질화 프로세스를 수행했으며, 추론 시간은 28~11초로 측정되었고, RDFox는 2062~467초가 소요되었다.
RDFox는 데이터 임포트 단계에서 더 빠른 성능(예: Claros에서 48초 대비 242초)을 보였지만, 자주 발생하는 데이터 업데이트를 고려할 때 NeTS의 자료 물질화 속도 우월성이 실질적으로 더 큰 영향을 미친다.
RTN 모델의 학습 단계는 각 데이터셋당 3~4일이 소요되었지만, 이는 온라인 추론과 별개의 일회성 설정 비용으로 간주된다.
결과적으로 깊이 학습 기반 추론이 정확도 면에서 논리 기반 추론을 따라하거나 초월할 수 있으며, 대규모 지식 기반에서 속도 면에서 크게 앞서는 것으로 나타났다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.