Skip to main content
QUICK REVIEW

[論文レビュー] Neural Metric Learning for Fast End-to-End Relation Extraction

Tung Tran, Ramakanth Kavuluru|arXiv (Cornell University)|May 17, 2019
Topic Modeling参考文献 41被引用数 40
ひとこと要約

表ベースのエンドツーエンドの関係抽出モデルを導入し、2D畳み込みを用いた関係測距ネットワークでNERとREを同時学習する。訓練/推論時間が大幅に高速化され、最先端の結果を達成。

ABSTRACT

Relation extraction (RE) is an indispensable information extraction task in several disciplines. RE models typically assume that named entity recognition (NER) is already performed in a previous step by another independent model. Several recent efforts, under the theme of end-to-end RE, seek to exploit inter-task correlations by modeling both NER and RE tasks jointly. Earlier work in this area commonly reduces the task to a table-filling problem wherein an additional expensive decoding step involving beam search is applied to obtain globally consistent cell labels. In efforts that do not employ table-filling, global optimization in the form of CRFs with Viterbi decoding for the NER component is still necessary for competitive performance. We introduce a novel neural architecture utilizing the table structure, based on repeated applications of 2D convolutions for pooling local dependency and metric-based features, that improves on the state-of-the-art without the need for global optimization. We validate our model on the ADE and CoNLL04 datasets for end-to-end RE and demonstrate $\approx 1\%$ gain (in F-score) over prior best results with training and testing times that are seven to ten times faster --- the latter highly advantageous for time-sensitive end user applications.

研究の動機と目的

  • NERとRE間のタスク間相関を活用して、エンドツーエンドのE2E REを動機づける。
  • 局所および全体情報をプールするために、メトリックベースの特徴と2D畳み込みを用いる表埋め込みニューラルアーキテクチャを提案する。
  • ビーム探索などの高コストなデコーディングを必要とせず、精度を向上させる。
  • ベンチマークデータセット(CoNLL04とADE)で最先端の性能とより速い訓練/推論時間を示す。
  • 隠れプーリング層の分析を通じた解釈可能性の洞察を提供する。

提案手法

  • 対角線にBILOUエンコードされたエンティティを配置し、交差するエンティティ区間上に関係タグを置くn x nテーブルに対してREを表現として定式化する。
  • 関連性関数 s_R(h_i, h_j) = h_i^T R^k h_j を複数のメトリックチャネル(Gテンソル)にわたって学習する関係メトリックネットワークを導入する。
  • 語と文字特徴に対してBi-LSTMを用いて文脈埋め込みを計算する。
  • 3x3の2D畳み込みの前に、依存関係および位置埋め込みを組み込み、ペアワイズ特徴を豊富にする。
  • 情報を伝播させるためにλ個の畳み込み層による反復プーリングを適用し、初期の決定を裏付ける。
  • 共起するエンティティ区間でQスコアを集約し、最大値タグを選択して関係をデコードする。

実験結果

リサーチクエスチョン

  • RQ1ビーム探索やCRFによるデコーディングに頼らず、エンドツーエンドのNERとREを統一されたアーキテクチャで効果的にモデル化するにはどうすればよいか?
  • RQ2メトリックベースの特徴と局所プーリングを備えた表ベース表現は、トークン間の関係を効率的かつ正確に捉えられるだろうか?
  • RQ3提案されたアーキテクチャは、ベンチマークデータセットでF1を維持または向上させつつ、訓練および推論速度を改善するか?
  • RQ4依存関係埋め込みと位置埋め込みがエンドツーエンドREの性能に与える影響は何か?
  • RQ5隠れプーリング層と中間決定の可視化によってモデルは解釈可能か?

主な発見

モデルEntity PEntity REntity FRel PRel RRel FTrain TimeTest Time
Table Representation Miwa and Sasaki (2014)81.2080.2080.7076.0050.9061.00--
Multihead Bekoulis et al. (2018b)83.7584.0683.9063.7560.4362.04--
Replicating Multihead with AT Bekoulis et al. (2018a)84.3685.8085.0765.8157.5961.38614 sec34 sec
Relation-Metric (Ours)†84.4684.6784.5767.9758.1862.68101 sec4.5 sec
---------
---------
---------
---------
  • CoNLL04とADEで競争力のF1スコアを達成し、訓練と推論の速度向上が著しい(CoNLL04でテスト時間7–10x高速、ADE variantsでテスト時間4.5秒)。
  • CoNLL04では、Relation-Metric (Ours) はREのF1約84.57、NERのP 84.46 R 84.67を達成。
  • ADEではRelation-Metric (Ours) がRE F1 77.29、NER F1 87.11を達成。
  • 従来の最先端手法を再現または上回りつつ、ビーム探索などの高コストなデコodingを回避。
  • モデルは3x3の2D畳み込みプーリング戦略を3D入力(G, D, P)上で用い、局所とグローバル特徴を統合する。
  • 訓練と推論時間が明示的に報告され、実用的な効率向上を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。