Skip to main content
QUICK REVIEW

[論文レビュー] Wembedder: Wikidata Entity Embedding Web Service

Finn Årup Nielsen|arXiv (Cornell University)|Oct 11, 2017
Topic Modeling参考文献 15被引用数 11
ひとこと要約

Wembedder は、Wikidata の知識グラフのグラフウォーク上で Word2Vec を用いて生成された、600,000 以上の Wikidata アイテムおよびプロパティの事前学習済み多言語エンベッディングを提供する RESTful ウェブサービスです。このサービスにより、スケーラブルでアクセス可能な API を通じて、多言語の知識グラフエンティティ間の効率的な意味的類似性照会が可能になります。

ABSTRACT

I present a web service for querying an embedding of entities in the Wikidata knowledge graph. The embedding is trained on the Wikidata dump using Gensim's Word2Vec implementation and a simple graph walk. A REST API is implemented. Together with the Wikidata API the web service exposes a multilingual resource for over 600'000 Wikidata items and properties.

研究の動機と目的

  • Wikidata エンティティおよびプロパティの意味的エンベッディングをスケーラブルかつアクセス可能なウェブサービスとして提供すること。
  • Wikidata の構造化された知識グラフを対象とした多言語対応の意味的類似性照会を可能にすること。
  • 拡張性の高い知識取得と相互運用性を向上させるために、Wikidata API との統合を図ること。
  • 研究者および開発者が、自然言語処理および知識グラフアプリケーションの下流タスクに活用可能な、事前学習済みで転移可能なエンベッディングを提供すること。

提案手法

  • Wikidata 知識グラフ上のランダムウォークを用いて Gensim の Word2Vec を用いてエンティティエンベッディングを学習すること。
  • エンティティとその関係をたどるグラフウォークを構築し、意味的および構造的文脈を捉えること。
  • 多言語環境下で、Wikidata アイテムおよびプロパティの密なベクトル表現を生成すること。
  • プログラムによるアクセスを可能にするため、標準化された REST API を通じてエンベッディングを公開すること。
  • Wembedder API と Wikidata API を統合し、相互参照可能な知識取得を可能にすること。

実験結果

リサーチクエスチョン

  • RQ1どのようにして Wikidata のエンティティエンベッディングを、広範なアクセスを可能にするウェブサービスとして効率的に公開できるか?
  • RQ2グラフウォークに基づく Word2Vec エンベッディングは、Wikidata において意味的な関係をどの程度適切に捉えられるか?
  • RQ3Wikidata で学習された多言語対応のエンベッディングモデルは、多様な言語間で効果的な意味的類似性照会を可能にするか?
  • RQ4Wembedder と Wikidata API の統合は、知識グラフ照会の能力をどの程度向上させるか?

主な発見

  • Wembedder サービスは、REST API を通じて 600,000 以上の Wikidata エンティティおよびプロパティの事前学習済みエンベッディングを効果的に公開している。
  • エンベッディングは多言語対応であり、グラフウォークを用いて学習されているため、多様な言語のエントリ間での意味的類似性計算が可能である。
  • サービスは Wikidata API とシームレスに統合されており、意味的検索および知識取得ワークフローが強化されている。
  • Wikidata のグラフ構造上で Word2Vec を用いることで、知識グラフアプリケーションに適した意味的で転移可能なベクトル表現が得られた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。