QUICK REVIEW
[논문 리뷰] Wembedder: Wikidata Entity Embedding Web Service
Finn Årup Nielsen|arXiv (Cornell University)|2017. 10. 11.
Topic Modeling참고 문헌 15인용 수 11
한 줄 요약
Wembedder는 Wikidata 지식 그래프의 그래프 워크에서 Word2Vec을 사용하여 생성한 사전 훈련된 다국어 엔티티 임베딩을 제공하는 RESTful 웹 서비스입니다. 이 서비스는 60만 개 이상의 Wikidata 항목과 속성에 대해 다국어 지식 그래프 엔티티 간의 효율적인 의미 유사성 쿼리를 가능하게 하는 확장 가능한 접근 가능한 API를 제공합니다.
ABSTRACT
I present a web service for querying an embedding of entities in the Wikidata knowledge graph. The embedding is trained on the Wikidata dump using Gensim's Word2Vec implementation and a simple graph walk. A REST API is implemented. Together with the Wikidata API the web service exposes a multilingual resource for over 600'000 Wikidata items and properties.
연구 동기 및 목표
- Wikidata 엔티티와 속성의 의미 임베딩을 위한 확장 가능하고 접근 가능한 웹 서비스를 제공하는 것.
- Wikidata의 구조화된 지식 그래프를 기반으로 한 다국어 의미 유사성 쿼리를 가능하게 하는 것.
- 향상된 지식 검색과 상호운용성을 위해 Wikidata API와 통합하는 것.
- 연구자와 개발자가 후속 NLP 및 지식 그래프 응용 프로그램을 위해 사전 훈련된 이식 가능한 임베딩을 활용할 수 있도록 지원하는 것.
제안 방법
- Wikidata 지식 그래프 위에서 무작위 워크를 기반으로 Gensim의 Word2Vec을 사용하여 엔티티 임베딩을 훈련하는 것.
- 엔티티와 그 관계를 순회하는 그래프 워크를 구성하여 의미적 및 구조적 맥락을 포착하는 것.
- 다국어 환경에서 Wikidata 항목과 속성에 대한 조밀한 벡터 표현을 생성하는 것.
- 프로그래밍적 접근을 위한 표준화된 REST API를 통해 임베딩을 노출하는 것.
- Wembedder API와 Wikidata API를 결합하여 교차 참조 지식 검색을 가능하게 하는 것.
실험 결과
연구 질문
- RQ1어떻게 Wikidata 엔티티의 임베딩을 널리 접근 가능한 웹 서비스로 효율적으로 노출시킬 수 있는가?
- RQ2그래프 워크 기반의 Word2Vec 임베딩이 Wikidata에서 의미 있는 의미 관계를 얼마나 잘 포착하는가?
- RQ3Wikidata에서 훈련된 다국어 임베딩 모델이 다양한 언어 간에 효과적인 의미 유사성 쿼리를 지원할 수 있는가?
- RQ4Wembedder가 Wikidata API와 통합될 경우 지식 그래프 쿼리 기능이 어떻게 향상되는가?
주요 결과
- Wembedder 서비스는 REST API를 통해 60만 개 이상의 Wikidata 엔티티와 속성에 대한 사전 훈련된 임베딩을 성공적으로 노출했습니다.
- 임베딩은 다국어이며 그래프 워크를 기반으로 훈련되어 다양한 언어의 항목 간 의미 유사성 계산이 가능합니다.
- 서비스는 Wikidata API와 원활하게 통합되어 의미 기반 검색 및 지식 검색 워크플로우를 향상시킵니다.
- Wikidata의 그래프 구조에 기반한 Word2Vec은 지식 그래프 응용 프로그램을 위한 의미 있는 이식 가능한 벡터 표현을 생성합니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.