QUICK REVIEW

[論文レビュー] Transforming Question Answering Datasets Into Natural Language Inference Datasets

Dorottya Demszky, Kelvin Guu|arXiv (Cornell University)|Sep 9, 2018

Topic Modeling参考文献 32被引用数 122

ひとこと要約

本論文は、QAデータをQA2D変換を介して大規模なNLIデータセットへ自動化的に変換し、500k件を超える例を含むQA-NLIを作成し、複数のQA領域に一般化するニューラルQA2Dモデルを訓練する。

ABSTRACT

Existing datasets for natural language inference (NLI) have propelled research on language understanding. We propose a new method for automatically deriving NLI datasets from the growing abundance of large-scale question answering datasets. Our approach hinges on learning a sentence transformation model which converts question-answer pairs into their declarative forms. Despite being primarily trained on a single QA dataset, we show that it can be successfully applied to a variety of other QA resources. Using this system, we automatically derive a new freely available dataset of over 500k NLI examples (QA-NLI), and show that it exhibits a wide range of inference phenomena rarely seen in previous NLI datasets.

研究の動機と目的

豊富なQAデータセットを活用してNLIを多様化する動機付け。
QAデータから含意/NLIで含意なしのペアを作成する、完全自動のQA2D変換を提案する。
QA由来のNLIが、既存データセットを超える幅広い推論現象をカバーすることを実証する。
高品質な陳述を生成するため、ルールベース、クラウドソース、およびニューラルQA2Dコンポーネントを組み合わせたスケーラブルなパイプラインを提供する。

提案手法

QA2Dを定義する: QAペア（パッセージP、質問Q、回答A）を、質問Qに答えるようにAを言い換えた宣言文Dへ変換する。
Aが正しい場合には含意のあるNLIペア（P, D）を構築し、Aが誤っている場合やQが回答不能な場合には非含意を構築する。
3つのQA2Dアプローチを開発する: ルールベース、クラウドソース、ニューラル系列モデル。
高品質な宣言文をクラウドソーシングする二つの設定（ゼロから作成するか、ルールベース出力をポスト編集するか）でクラウドソーシングして、ニューラルQA2Dモデルを訓練する。
Dを生成するために、QとAを入力としてニューラルエンコーダ-デコーダモデルを訓練し、コピー機構とGloVe埋め込みを使用する。

実験結果

リサーチクエスチョン

RQ1QA由来の宣言文は、さまざまなQAデータセット全体で有効なNLIペアを生み出せるか。
RQ2ニューラルQA2DモデルはSQuADを超えるQAデータセットにどれくらい一般化できるか。
RQ3自動化されたQA2D生成のNLIデータセットは、従来のNLIコーパスより広範な推論現象を明らかにするか。
RQ4QA2Dの品質がNLI学習や注釈アーティファクトに与える影響は何か？

主な発見

QA2DはQAの例を「含意あり／含意なし」NLIペアへ変換でき、大規模なNLIの構築を可能にする。
ニューラルQA2Dモデルは、データセット全体でルールベースシステムをBLEUと厳密一致の指標で一貫して上回る。
ニューラルモデルは、ルールベースアプローチより高いBLEUと厳密一致スコアを達成する（平均増分: 約2.6 BLEUと約6.2%の精度）。
五つのQAソースから派生したQA-NLIデータセットは、500k件を超えるNLI例を含み、多様な推論現象を含む（複数文の推論やメタレベルの推論を含む）。
QA-NLIはSNLI/MultiNLIで観察されるいくつかの注釈アーティファクトを減らし、ドメイン（映画の筋書き、ニュース、Wikipedia、試験）をまたぐさまざまな推論タイプを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。