Skip to main content
QUICK REVIEW

[論文レビュー] Knowledge Enhanced Pretrained Language Models: A Compreshensive Survey

Xiaokai Wei, Shen Wang|arXiv (Cornell University)|Oct 16, 2021
Topic Modeling参考文献 110被引用数 25
ひとこと要約

知識強化事前学習言語モデル(KE-PLMs)の包括的な調査で、知識源、粒度、および応用の3つの分類を提示し、方法、データセット、応用、課題、および将来の方向性について議論する。

ABSTRACT

Pretrained Language Models (PLM) have established a new paradigm through learning informative contextualized representations on large-scale text corpus. This new paradigm has revolutionized the entire field of natural language processing, and set the new state-of-the-art performance for a wide variety of NLP tasks. However, though PLMs could store certain knowledge/facts from training corpus, their knowledge awareness is still far from satisfactory. To address this issue, integrating knowledge into PLMs have recently become a very active research area and a variety of approaches have been developed. In this paper, we provide a comprehensive survey of the literature on this emerging and fast-growing field - Knowledge Enhanced Pretrained Language Models (KE-PLMs). We introduce three taxonomies to categorize existing work. Besides, we also survey the various NLU and NLG applications on which KE-PLM has demonstrated superior performance over vanilla PLMs. Finally, we discuss challenges that face KE-PLMs and also promising directions for future research.

研究の動機と目的

  • 知識認識の限界に対処するため、事前学習言語モデルへ知識を統合する研究を喚起する。
  • 知識源・粒度・応用に基づくKE-PLMsの体系的分類を提供する。
  • NLUおよびNLGタスクにおける影響力のある手法・目的・データセットを調査する。
  • 課題を論じ、将来のKE-PLM研究の有望な方向性を提案する。

提案手法

  • 知識源、粒度、応用によってKE-PLMsを分類する3つの分類法を導入する。
  • カテゴリ(言語的、百科事典的、常識、ドメイン特化)全体の代表的手法と知識統合戦略を概観する。
  • KE-PLMsのNLUおよびNLGタスクにおける性能を示すデータセットと応用を要約する。
  • 方法と特徴の統合表を用いてアプローチを比較する。

実験結果

リサーチクエスチョン

  • RQ1KE-PLMsの構築に用いられた知識源は何か(言語的、百科事典的、常識、ドメイン特化)?
  • RQ2KE-PLMsにおける異なる粒度(テキストチャンク、エンティティ、リレーション、サブグラフ)でどのように知識が組み込まれているか?
  • RQ3KE-PLMsの恩恵を受けるNLPタスクと応用は何か、またこの利得を示すベンチマーク/データセットは何か?
  • RQ4KE-PLMsの主な課題と将来の方向性(効率性、ノイズ耐性、知識選択など)は何か?

主な発見

  • KE-PLMsは多様な知識源(言語的、百科事典的、常識、ドメイン特化)を統合し、通常のPLMsを超えた知識認識を強化する。
  • 知識は複数の粒度で活用され、テキストチャンク、エンティティレベルの手がかり、関係三重項、サブグラフなどに対応するモデリング手法が用いられる。
  • KE-PLMsはエンティティ型指定、関係分類、QA、常識推論、テキスト生成など、NLUおよびNLGタスクの多様な領域で性能向上を示す。
  • KE-PLMsを評価するために、LAMA、コモンセンスQA、KG関連タスクなどの多様なデータセットとベンチマークが用いられ、幅広い適用性を示している。
  • 本調査は効率性、ノイズ、データ品質といった課題を指摘し、将来の研究方向としてより広い応用、より多くの知識源、頑健な学習、スケーラブルな推論を挙げている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。