Skip to main content
QUICK REVIEW

[논문 리뷰] Hyponymy Extraction Of Domain Ontology Concept Based On Ccrfs And Hierarchy Clustering*

Qiang Zhan|arXiv (Cornell University)|2015. 07. 31.
Advanced Text Analysis Techniques참고 문헌 9인용 수 2
한 줄 요약

이 논문은 자유 텍스트에서 의미 있는 온톨로지 계층을 추출하는 데 높은 효율성을 보이는, 계층적 조건부 랜덤 필드(CCRFs)를 사용한 두 단계의 하위개념 추출 방법을 제안한다. 먼저 CCRFs를 통해 단순 및 중첩된 도메인 개념을 식별하고, 이후 계층적 군집화를 통해 하위관계를 수립한다.

ABSTRACT

Concept hierarchy is the backbone of ontology, and the concept hierarchy acquisition has been a hot topic in the field of ontology learning. this paper proposes a hyponymy extraction method of domain ontology concept based on cascaded conditional random field(CCRFs) and hierarchy clustering. It takes free text as extracting object, adopts CCRFs identifying the domain concepts. First the low layer of CCRFs is used to identify simple domain concept, then the results are sent to the high layer, in which the nesting concepts are recognized. Next we adopt hierarchy clustering to identify the hyponymy relation between domain ontology concepts. The experimental results demonstrate the proposed method is efficient.

연구 동기 및 목표

  • 도메인 온톨로지 학습에서 개념 계층을 자동으로 확보하는 데 도전하는 데 목적을 두며.
  • 비정형 텍스트에서 단순 및 중첩된 도메인 개념을 정확하게 식별하는 것을 향상시키는 데 목적을 두며.
  • 군집화 기법을 사용하여 온톨로지 개념 간 신뢰할 수 있는 하위관계를 수립하는 데 목적을 두며.
  • 계층적 조건부 랜덤 필드를 통해 개념 인식을 향상시키는 계류 모델을 개발하는 데 목적을 두며.

제안 방법

  • 이 방법은 이중 구조를 가진 계류 조건부 랜덤 필드(CCRFs)를 활용하며, 하위 레이어는 단순 도메인 개념을 식별하고, 상위 레이어는 중첩된 개념을 탐지한다.
  • 하위 CCRF 레이어의 출력 결과가 상위 레이어로 입력되어 복잡하거나 중첩된 도메인 개념을 보다 정밀하게 탐지한다.
  • 식별된 도메인 개념에 대해 계층적 군집화를 적용하여 의미적 및 구조적 유사성 기반으로 하위관계를 발견한다.
  • 입력으로 자유 텍스트를 처리함으로써 사전 애너테이션된 데이터가 필요 없이 종단 간 추출이 가능하다.
  • 시퀀스 레이블링과 맥락 인식 특징 학습을 활용하여 도메인 전용 용어의 인식을 향상시킨다.

실험 결과

연구 질문

  • RQ1비정형 텍스트에서 단순 및 중첩된 도메인 개념을 효과적으로 식별하는 방법은 무엇인가?
  • RQ2진행적 개념 인식을 위해 조건부 랜덤 필드를 최적화하여 계류하는 방법은 무엇인가?
  • RQ3자유 텍스트에서 도메인 개념 간 하위관계를 어떻게 안정적으로 추출할 수 있는가?
  • RQ4계층적 군집화가 하위관계 탐지 정확도에 어느 정도 기여하는가?

주요 결과

  • 제안된 CCRF 기반 방법은 자유 텍스트에서 단순 및 중첩된 도메인 개념을 효과적으로 식별한다.
  • 계류 구조는 레이어 간 맥락적 의존성을 활용하여 인식 정확도를 향상시킨다.
  • 계층적 군집화 기법은 추출된 도메인 개념 간 하위관계를 성공적으로 수립한다.
  • 전반적인 방법은 원시 텍스트에서 도메인 온톨로지 계층을 추출하는 데 높은 효율성을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.