[論文レビュー] A Unified MRC Framework for Named Entity Recognition
本論文は平坦な NER とネストされた NER を機械読解(MRC)タスクとして再定義し、各エンティティ種類に対して自然言語のクエリを用いて跨度を抽出することで、ネスト型と平坦型の NER データセットの両方で最先端の結果を達成する。
The task of named entity recognition (NER) is normally divided into nested NER and flat NER depending on whether named entities are nested or not. Models are usually separately developed for the two tasks, since sequence labeling models, the most widely used backbone for flat NER, are only able to assign a single label to a particular token, which is unsuitable for nested NER where a token may be assigned several labels. In this paper, we propose a unified framework that is capable of handling both flat and nested NER tasks. Instead of treating the task of NER as a sequence labeling problem, we propose to formulate it as a machine reading comprehension (MRC) task. For example, extracting entities with the extsc{per} label is formalized as extracting answer spans to the question "{\it which person is mentioned in the text?}". This formulation naturally tackles the entity overlapping issue in nested NER: the extraction of two overlapping entities for different categories requires answering two independent questions. Additionally, since the query encodes informative prior knowledge, this strategy facilitates the process of entity extraction, leading to better performances for not only nested NER, but flat NER. We conduct experiments on both {\em nested} and {\em flat} NER datasets. Experimental results demonstrate the effectiveness of the proposed formulation. We are able to achieve vast amount of performance boost over current SOTA models on nested NER datasets, i.e., +1.28, +2.55, +5.44, +6.37, respectively on ACE04, ACE05, GENIA and KBP17, along with SOTA results on flat NER datasets, i.e.,+0.24, +1.95, +0.21, +1.49 respectively on English CoNLL 2003, English OntoNotes 5.0, Chinese MSRA, Chinese OntoNotes 4.0.
研究の動機と目的
- 単一のフレームワーク内で、ネストされた(重複する)NER と平坦なNERの課題に対応する。
- クエリを介してエンティティカテゴリに関する事前知識を注入するために機械読解を活用する。
- エンドツーエンドで学習可能なモデルを用いて、ネスト型および平坦型 NER の両方の抽出精度を向上させる。
- 多様なベンチマークにおいて、既存の最先端モデルを上回る強力な実証的向上を示す。
- クエリ構築とデータ効率が NER の性能に与える影響を分析する。
提案手法
- 各エンティティタイプ y に自然言語クエリ q_y を割り当て、文脈 X から回答として跨度を抽出することで、NER を SQuAD 風の MRC タスクとして定式化する。
- 結合されたクエリと文脈をエンコードするバックボーンとして BERT を用い、跨度抽出のためのトークン表現を生成する。
- 開始/終了跨度選択スキームを二つの二値分類器で採用し、開始点と終了点を予測してクエリあたり複数の跨度を可能にする。
- 予測された開始点と終了点を組み合わせて有効なエンティティ跨度とするため、開始-終了整合性を判定する追加の分類器を訓練し、結合損失を最小化する。
- 事前学習済み BERT 表現を用いて L_start, L_end, および L_span を結合的に訓練し、エンドツーエンドの最適化を可能にする。
- 注釈ガイドラインからクエリを生成(代替案を探求)して、エンティティカテゴリに関する事前知識を符号化する。
実験結果
リサーチクエスチョン
- RQ1NER を統一された MRC 問題として位置づけることで、個別のモデルを用いずに平坦な NER とネストされた NER の両方を扱えるか?
- RQ2自然言語クエリと事前知識を組み込むことは、特に重複するエンティティの抽出を改善するか?
- RQ3クエリ構築戦略が NER の性能とデータ効率に与える影響は何か?
- RQ4ゼロショット設定で未知のラベル集合に対して BERT-MRC アプローチはどれだけ転移できるか?
- RQ5MRC 形式化と事前学習の寄与は、性能向上においてどの程度か?
主な発見
- BERT-MRC は nested NER データセット ACE04、ACE05、GENIA、KBP17 で SOTA あるいは SOTA に近い結果を達成し、 prior models と比べて顕著な F1 増分を示す。
- ネストされた NER では、BERT-MRC は ACE04 で 85.98、ACE05 で 86.88、GENIA で 83.75、KBP17 で 80.97 の F1 を達成し、それぞれ前回の SOTA を +1.28、+2.55、+5.44、+6.37 上回る。
- 平坦なNERでは、BERT-MRC が英語 CoNLL-2003 を +0.24F1、英語 OntoNotes 5.0 を +1.95F1、 中国語 MSRA を +0.21F1、 中国語 OntoNotes 4.0 を +1.49F1 それぞれ強力なベースラインより改善した。
- ゼロショット実験は、BERT-MRC が unseen ラベルへタグベースのベースラインより一般化できることを示すが、見られるラベルのタグ付けより絶対性能は低い。
- クエリ構築は性能に影響を与える。注釈ガイドラインノートは最高の F1 をもたらし、同義語やキーワードベースのバリアントも単純なテンプレートより改善を提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。