[논문 리뷰] A Semantic Model for Historical Manuscripts
이 논문은 RDF, SPARQL 생성문, SWRL 규칙를 사용하여 시간적 추론와 변화하는 용어 표현을 가능하게 하는 역사적 과학 수기의 의미 모델을 제시한다. 이 모델은 인용 및 맥락 데이터로부터 글쓰기 일정을 유추하고, 저자 개념과 관계와 같은 시간에 따라 변화하는 지식의 반추적 인덱싱과 추론을 지원한다.
Representing and reasoning on contexts is an open problem in the semantic web. Despite the fact that context representation has for a long time been treated locally by semantic web practitioners, a recognized and widely accepted consensus regarding the way of encoding and particularly reasoning on contextual knowledge has not yet been reached by far. In this paper, we present OWL^C : a contextual two-dimensional web ontology language. Using the first dimension, we can reason on contexts-dependent classes, properties, and axioms and using the second dimension, we can reason on knowledge about contexts which we consider formal objects, as proposed by McCarthy [McCarthy, 1987]. We demonstrate the modeling strength and reasoning capabilities of OWL^C with a practical scenario from the digital humanity domain. We chose the Ferdinand de Saussure [Joseph, 2012] use case in virtue of its inherent contextual nature, as well as its notable complexity which allows us to highlight many issues connected with contextual knowledge representation and reasoning.
연구 동기 및 목표
- 역사적 과학 수기에서 시간에 따라 변화하는 용어와 지식을 해석하는 데 도전하는 데 목적이 있다.
- 학자들이 수기를 날짜별로 분류하고 아이디어의 연대적 진화를 재구성하는 데를 지원하는 데 목적이 있다.
- 시적 의미를 통합한 전사, 온톨로지, 용어집을 포함하는 다중 지식 자원 모델을 개발하는 데 목적이 있다.
- 텍스트 기반 참조로부터 시간 제약이 있는 관계(예: '○○ 기간 동안 안다')의 의미 인덱싱과 추론을 가능하게 하는 데 목적이 있다.
- 진행 중인 학술 코퍼스에 대한 디지털 인문학 연구를 위한 재사용 가능한 프레임워크를 구축하는 데 목적이 있다.
제안 방법
- 모델은 RDF 기반 온톨로지, 용어집, 전사, 시간 간격을 통합한 다중 지식 자원 아키텍처를 사용한다.
- 시간에 따라 변화하는 성질, 예를 들어 '○○ 기간 동안 안다'와 같은 관계에 대해 빈 노드 FluentRelation 인스턴스를 생성하기 위해 SPARQL CONSTRUCT 쿼리를 사용한다.
- 시간적 추론은 'filter not exists'를 사용한 재귀적 SPARQL 쿼리 실행을 통해 중복된 프로퍼티 생성을 방지함으로써 구현된다.
- SWRL 규칙는 표준 논리적 추론을 위해 사용되며, 비단조화적이고 유동적인 관계는 사용자 정의 SPARQL 생성문이 처리한다.
- 분포 유사도를 적용하여 시간대별 용어의 진화를 평가한다.
- 유한한 시간 간격으로 인해 종료 보장이 되는 바탕으로, 새로운 삼항관계가 생성되지 않을 때까지 쿼리를 반복 실행함으로써 완전성을 확보하는 피드백 루프를 적용한다.
실험 결과
연구 질문
- RQ1역사적 수기에서 변화하는 용어를 시간에 따라 형식적으로 표현할 수 있는 방법은 무엇인가?
- RQ2학술 수기에서 시간에 따라 변화하는 도메인 지식의 반추적 의미 인덱싱을 가능하게 하는 기법은 무엇인가?
- RQ3시간적 추론은 간접적 참조(예: 이름, 사건, 기관)로부터 수기 작성 일정과 순서를 유추할 수 있는가?
- RQ4SPARQL와 SWRL은 '○○ 기간 동안 안다'와 같은 동적이고 시간 제약이 있는 관계를 모델링하는 데 어떤 역할을 하는가?
- RQ5SPARQL와 추론 도구를 조합한 하이브리드 추론 파이프라인은 시간 지식 추출의 완전성과 정확성을 보장할 수 있는가?
주요 결과
- 시스템은 수백 건의 전사와 15개의 용어 자원을 시간 주석이 추가된 RDF 지식 기반에 성공적으로 통합하였다.
- SPARQL CONSTRUCT 쿼리는 유한한 시간 간격으로 인해 중복 없이 유효한 FluentRelation 인스턴스를 생성하였으며, 종료 보장이 되었다.
- 재귀적 추론 파이프라인은 새로운 삼항관계가 생성되지 않을 때까지 쿼리를 반복 실행함으로써 완전성을 달성하였다.
- 모델은 문헌 인용 및 명칭 엔터티와 같은 간접적 참조를 통해 글쓰기 순서와 개념의 진화를 추론할 수 있다.
- 이 프레임워크는 특정 시기와 연관된 용어 변화를 연결함으로써 소수르의 지적 발전 과정을 재구성하는 데 기여한다.
- 경량적이고 확장 가능한 의미 기술을 사용하여 역사적 수기의 대규모 의미 강화가 가능함을 입증하였다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.