Skip to main content
QUICK REVIEW

[논문 리뷰] A Semantic Similarity Measure for Expressive Description Logics

Claudia d’Amato, Nicola Fanizzi|ArXiv.org|2009. 11. 26.
Semantic Web and Ontologies참고 문헌 24인용 수 66
한 줄 요약

이 논문은 표현력 있는 서술 논리(Logics)인 ALC와 같은 분야에서 개념 기술, 개별 개체, 그리고 개념-개별 개체 쌍 간의 유사도를 집합 기반의 교집합과 기수 비율을 사용하여 계산하는 완전한 의미적 유사도 측정 방법을 제안한다. 이 방법은 포함관계 및 인스턴스 확인 추론을 활용하여 표준 DL 추론의 복잡도로 제한되며, 공식적인 의미 기반을 갖춘 의미 웹 응용 프로그램에서 클러스터링 및 검색을 가능하게 한다.

ABSTRACT

A totally semantic measure is presented which is able to calculate a similarity value between concept descriptions and also between concept description and individual or between individuals expressed in an expressive description logic. It is applicable on symbolic descriptions although it uses a numeric approach for the calculus. Considering that Description Logics stand as the theoretic framework for the ontological knowledge representation and reasoning, the proposed measure can be effectively used for agglomerative and divisional clustering task applied to the semantic web domain.

연구 동기 및 목표

  • 지식 기반 구축 및 통합 작업에서 표현력 있는 서술 논리에 대한 완전한 의미적 유사도 측정 방법의 부족을 해결하기 위해.
  • 개념 간의 유사도뿐만 아니라, 개별 개체 간, 그리고 개념과 개별 개체 간의 유사도 계산을 가능하게 하기 위해.
  • DL 기반 온톨로지에서 응집형 및 분할형 클러스터링, 정보 검색, 사례 기반 추론을 지원하기 위해.
  • 일阶논리 표현에서 문법적 또는 히우리스틱 기반의 유사도 측정 방법의 한계를 극복하기 위해.
  • 문법적 구조가 아닌 공식적인 의미 기반으로 설계된 방법을 개발하여 표준 포함관계 추론과의 호환성을 보장하기 위해.

제안 방법

  • 유사도 측정 방법 s(C, D)는 개념 확장의 교집합 |II|, 그리고 개별 개념 기술의 기수 |CI|와 |DI|를 사용하여 정의된다.
  • 핵심 공식은 s(C, D) = |II| / (|CI| + |DI| - |II|) * max(|II|/|CI|, |II|/|DI|)이며, 집합 겹침과 상대적 특이성의 조합을 포함한다.
  • 개별 개체-개념 유사도의 경우, 개별 개체의 가장 구체적인 개념(Most Specific Concept, MSC)을 근사하여 기준 개념으로 사용한다.
  • 개별 개체-개별 개체 유사도의 경우, 양쪽 개체의 MSC 근사치를 각각 계산하고 동일한 공식을 사용하여 비교한다.
  • 이 방법은 개념 확장을 계산하고 MSC 근사치를 도출하기 위해 표준 DL 인스턴스 확인 추론에 의존한다.
  • 복잡도는 인스턴스 확인 복잡도 C(IC)의 함수로 분석되며, 개념-개념 유사도의 경우 C(s) = 3·C(IC)이다.

실험 결과

연구 질문

  • RQ1표현력 있는 서술 논리에 대해 개념, 개별 개체, 개념-개별 개체 쌍 간의 완전한 의미적 유사도 측정 방법을 정의할 수 있는가?
  • RQ2개별 개체의 가장 구체적인 개념(Most Specific Concept, MSC)은 다양한 의미적 유형 간의 유사도 계산을 일반화하는 데 어떻게 활용될 수 있는가?
  • RQ3제안된 유사도 측정 방법의 계산 복잡도는 표준 DL 추론 작업과 비교하여 어떻게 되는가?
  • RQ4현재 접근 방식은 왜 개별 개체 간에 의미 있는 유사도를 포착하지 못하는가? 이 문제는 어떻게 해결될 수 있는가?
  • RQ5거리 기반 접근 방식을 사용하여 겹치지 않는 개념을 다룰 수 있는가?

주요 결과

  • 제안된 유사도 측정 방법 s는 모든 유사도 함수의 공식적 성질을 만족한다: 음수성 방지, 대칭성, 자기 유사도 최대화.
  • 측정 방법은 ALC의 의미론에 공식적으로 기반하여 포함관계 및 인스턴스 확인을 활용하여 표준 추론 서비스와의 호환성을 보장한다.
  • 개념-개념 유사도의 경우 복잡도는 3·C(IC)이며, 여기서 C(IC)는 대상 DL(예: ALC의 경우 PSPACE)에서 인스턴스 확인의 복잡도이다.
  • 개별 개체-개념 또는 개별 개체-개별 개체 유사도의 경우, MSC 근사치 계산이 필요하므로 C(MSC*)의 복잡도가 추가로 증가한다.
  • MSC 근사치가 지나치게 구체적이어서 의미적으로 유사한 개별 개체 간에도 부당한 이질성으로 이어지는 문제점이 존재한다.
  • 저자들은 MSC 근사치의 일반화를 통해 특이성을 감소시키고 개별 수준 비교에서의 유사도 탐지 능력을 향상시키기 위한 필요성을 지적한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.