Skip to main content
QUICK REVIEW

[論文レビュー] Learning from History: Modeling Temporal Knowledge Graphs with Sequential Copy-Generation Networks

Cunchao Zhu, Muhao Chen|arXiv (Cornell University)|Dec 15, 2020
Advanced Graph Neural Networks参考文献 45被引用数 26
ひとこと要約

この論文では、履歴パターンから学習することで将来の事実を予測する、タイムスタンプに適応したコピーゲネレーション機構を活用する新規な時系列知識グラフ埋め込みモデル、CyGNetを提案する。既知の過去の事実を再利用するコピーモードと、新規予測を生成する生成モードを組み合わせることで、複数のベンチマークで最先端の性能を達成し、GDELTではMRRが10.80%、Hits@1が12.10%向上した。

ABSTRACT

Large knowledge graphs often grow to store temporal facts that model the dynamic relations or interactions of entities along the timeline. Since such temporal knowledge graphs often suffer from incompleteness, it is important to develop time-aware representation learning models that help to infer the missing temporal facts. While the temporal facts are typically evolving, it is observed that many facts often show a repeated pattern along the timeline, such as economic crises and diplomatic activities. This observation indicates that a model could potentially learn much from the known facts appeared in history. To this end, we propose a new representation learning model for temporal knowledge graphs, namely CyGNet, based on a novel timeaware copy-generation mechanism. CyGNet is not only able to predict future facts from the whole entity vocabulary, but also capable of identifying facts with repetition and accordingly predicting such future facts with reference to the known facts in the past. We evaluate the proposed method on the knowledge graph completion task using five benchmark datasets. Extensive experiments demonstrate the effectiveness of CyGNet for predicting future facts with repetition as well as de novo fact prediction.

研究の動機と目的

  • 時系列知識グラフ(TKG)の不完全性に取り組むために、履歴的事実パターンを活用するタイムスタンプに適応した表現学習モデルの開発を目的とする。
  • 経済的危機や外交的活動など、現実世界のダイナミクスで一般的な繰り返し発生する時系列的事実を明示的にモデル化することで、TKGにおける将来の事実予測を向上させることを目的とする。
  • 過去の事実からの再発性に配慮したコピーモードと、オープンボリュームの生成による新規事実予測を統合した包括的なフレームワークの設計を目的とする。
  • 特に再発率が高く、歴史的データが豊富な状況を想定して、ベンチマークデータセット上でモデルの有効性を評価することを目的とする。

提案手法

  • CyGNetは二重モード推論機構(コピーモードと生成モード)を採用し、既知の過去の事実を参照するか、または全エンティティ語彙から生成することで、事実を予測できる。
  • コピーモードはタイムスタンプに適応したアテンション機構を用い、同じサブジェクト・関係ペアで以前に観測された事実に基づいて将来の事実を特定・予測する。これは要約生成におけるコピーメカニズムを模倣する。
  • 生成モードは、全オープンワールド語彙からのエンティティ予測を実行し、以前に見られなかった新規事実への一般化を保証する。
  • 最終的な予測は二つのモードの重み付き組み合わせであり、既知のパターンの再利用と新規事実の生成の間で動的にバランスを取れるように設計されている。
  • モデルは、時系列知識グラフ補完タスクにおけるリンク予測性能を最適化するために、ネガティブサンプリング戦略を用いてエンドツーエンドで訓練される。
  • 時間的ダイナミクスは、スナップショットごとに変化するタイムスタンプに適応したエンティティおよび関係埋め込みを通じて統合され、長期依存関係のモデル化を可能にする。

実験結果

リサーチクエスチョン

  • RQ1知識グラフ表現モデルは、履歴的事実から学習することで、時系列知識グラフにおける将来の事実予測を効果的に改善できるか?
  • RQ2時系列的再発パターンをモデル化することは、動的環境下での知識グラフ補完の性能にどのように影響を与えるか?
  • RQ3コピーベースの予測とオープンボリューム生成を組み合わせることで、再発性に配慮した予測と新規事実予測の両方がどの程度向上するか?
  • RQ4異なるデータセットにおけるサブジェクトおよびオブジェクトエンティティの再発率の変動に伴い、モデルの性能はどのように変化するか?
  • RQ5コピーモードと生成モードの両方が、全体の予測性能に果たす相対的貢献度はどの程度か?

主な発見

  • CyGNetは5つのベンチマークデータセットで最先端の性能を達成し、GDELTではMRRが10.80%、Hits@1が12.10%向上した。
  • ICEWS18では、コピーモードを削除するとMRRが46.69%に低下し、12.11%の低下を示し、履歴的事実の再利用が極めて重要な役割を果たしていることが明らかになった。
  • アブレーションスタディの結果、生成モードを削除するとMRRが4.09%低下し、新規事実予測の観点からもその重要性が裏付けられた。
  • 再発率がバランスの取れたデータセット(例:ICEWS14, ICEWS18)では、CyGNetは顕著に優れた性能を示したが、WIKIではサブジェクトとオブジェクト間の再発率の不均衡により限界が見られた。
  • 生成フェーズでコピーモードを排除した変種CyGNet -Generation-newは、完全なモデルに比べて性能が劣っており、元の設計がコピーや生成の両方を効果的に活用できていることが示された。
  • GDELTにおける優れた性能は、密度の高い履歴的事実が、コピーメカニズムが活用できる参照点を多く提供していることに起因すると考えられる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。