Skip to main content
QUICK REVIEW

[논문 리뷰] A Comprehensive Survey on Automatic Knowledge Graph Construction

Lingfeng Zhong, Jia Wu|arXiv (Cornell University)|2023. 02. 10.
Advanced Graph Neural Networks인용 수 11
한 줄 요약

자동 지식 그래프 구축에 대한 포괄적 고찰로, 획득, 정제 및 진화 프로세스와 더불어 자원, 도구 및 향후 방향을 자세히 다룬다.

ABSTRACT

Automatic knowledge graph construction aims to manufacture structured human knowledge. To this end, much effort has historically been spent extracting informative fact patterns from different data sources. However, more recently, research interest has shifted to acquiring conceptualized structured knowledge beyond informative data. In addition, researchers have also been exploring new ways of handling sophisticated construction tasks in diversified scenarios. Thus, there is a demand for a systematic review of paradigms to organize knowledge structures beyond data-level mentions. To meet this demand, we comprehensively survey more than 300 methods to summarize the latest developments in knowledge graph construction. A knowledge graph is built in three steps: knowledge acquisition, knowledge refinement, and knowledge evolution. The processes of knowledge acquisition are reviewed in detail, including obtaining entities with fine-grained types and their conceptual linkages to knowledge graphs; resolving coreferences; and extracting entity relationships in complex scenarios. The survey covers models for knowledge refinement, including knowledge graph completion, and knowledge fusion. Methods to handle knowledge evolution are also systematically presented, including condition knowledge acquisition, condition knowledge graph completion, and knowledge dynamic. We present the paradigms to compare the distinction among these methods along the axis of the data environment, motivation, and architecture. Additionally, we also provide briefs on accessible resources that can help readers to develop practical knowledge graph systems. The survey concludes with discussions on the challenges and possible directions for future exploration.

연구 동기 및 목표

  • 지식 그래프와 그 구축에 대한 형식적 기초와 분류 체계를 정의한다.
  • 다양한 데이터 환경에서 지식 획득, 정제, 진화의 방법을 체계적으로 검토한다.
  • KG 구축을 지원하는 실용적 자원, 데이터 세트 및 도구를 요약한다.
  • HACE 빅데이터 환경에서의 도전과제를 분석하고 KG의 해석가능성 및 진화에 대해 논의한다.
  • 지식 그래프 구축의 향후 방향과 남은 과제를 강조한다.

제안 방법

  • 형식적 정의와 배경 지식을 사용하여 지식 그래프와 구축 프로세스를 분류한다.
  • 획득, 정제 및 진화 단계에 걸친 300개 이상의 방법을 조사하여 패러다임을 비교한다.
  • 데이터 환경, 동기 부여 및 아키텍처적 고려사항에 따라 논의를 조직한다.
  • 실용적 KG 프로젝트, 데이터 세트 및 구축 도구에 대한 개요를 제공한다.
  • 잡음 데이터, 자원이 적은 환경, 모델 해석가능성에 대한 접근법을 검토한다.
  • KG 구축의 향후 연구 방향에 대한 지침을 제시한다.

실험 결과

연구 질문

  • RQ1지식 그래프와 그 구축 프로세스의 형식적 정의와 구성 요소는 무엇인가?
  • RQ2지식 획득, 정제 및 진화 방법은 데이터 환경과 과제에 따라 어떻게 다른가?
  • RQ3자동 KG 구축을 지원하는 실용적 자원(데이터 세트, 도구, 프로젝트)은 무엇이며 그 특성은 무엇인가?
  • RQ4KG 구축에서 HACE 빅데이터 환경의 주요 도전과제는 무엇이며 어떻게 해결할 수 있는가?
  • RQ5자동 KG 구축을 위한 향후 방향성과 남은 과제는 무엇인가?

주요 결과

  • 본 고찰은 300개가 넘는 방법을 다루며 KG 구축을 획득, 정제 및 진화의 세 단계 과정으로 제시한다.
  • 데이터 환경, 동기 부여 및 아키텍처를 따라 패러다임을 맵핑하여 접근법을 비교한다.
  • 백과사전형, 언어학적, 상식적, 기업용, 도메인 특정 및 연합(KG) 등 다양한 영역의 실용적 KG 프로젝트, 데이터 세트 및 도구의 목록을 제공한다.
  • 잡음 데이터, 문서 수준 데이터 및 자원이 부족한 데이터의 처리와 해석가능성 및 조건형/시간적 지식 그래프에 대해 논의한다.
  • 본 논문은 KG 구축을 위한 데이터, 모델 및 아키텍처의 도전과제와 향후 방향을 제시한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.