QUICK REVIEW

[論文レビュー] Adversarial Examples for Evaluating Reading Comprehension Systems

Robin Jia, Percy Liang|arXiv (Cornell University)|Jul 23, 2017

Topic Modeling参考文献 30被引用数 262

ひとこと要約

この論文はSQuADの敵対的評価を導入し、段落に惑わせる文を追加することで、16モデルがF1を ~75 から ~36 に落とし、さらには文法的でない惑わせる文を含むと ~7 に落ちることを示し、真の言語理解が限られていることを明らかにする。

ABSTRACT

Standard accuracy metrics indicate that reading comprehension systems are making rapid progress, but the extent to which these systems truly understand language remains unclear. To reward systems with real language understanding abilities, we propose an adversarial evaluation scheme for the Stanford Question Answering Dataset (SQuAD). Our method tests whether systems can answer questions about paragraphs that contain adversarially inserted sentences, which are automatically generated to distract computer systems without changing the correct answer or misleading humans. In this adversarial setting, the accuracy of sixteen published models drops from an average of $75\%$ F1 score to $36\%$; when the adversary is allowed to add ungrammatical sequences of words, average accuracy on four models decreases further to $7\%$. We hope our insights will motivate the development of new models that understand language more precisely.

研究の動機と目的

SQuADモデルが真の言語理解より表面的なパターンに依存しているかを評価する。
モデルを混乱させつつ正解を保持する敵対的手法を開発する。
敵対的に挿入された文に対する複数のモデルの頑健性を定量化する。
標準化された敵対的評価を可能にする公開コードとデータを提供する。

提案手法

互換性がありながら誤解を招く追加を伴い、(p, q, a) を (p', q', a') に変換する敵対的フレームワーク A を定義する。
段落に文を追加して結合型の敵対者 AddSent と AddOneSent を作成する。
探索戦略を介して任意の文や一般語の文を挿入する AddAny（および AddCommon）を設計する。
意味的摂動と型一致の偽の回答を用いて自動的に惑わせる文を生成し、その後で文法修正をクラウドソースする。
標準入力と敵対的入力を、複数のアーキテクチャ（BiDAF、Match-LSTM など）に対して評価する。
SQuAD 系統で AddSent/AddAny を実行する再現可能なコードとデータを提供する。

実験結果

リサーチクエスチョン

RQ1現在の読解モデルは真の言語理解を示しているか、表面的な手がかりに依存しているか？
RQ2正解と矛盾しない敵対的に挿入された文に対してモデルはどれだけ頑健か？
RQ3敵対的な脆弱性は異なるモデルやアーキテクチャ間で移転可能か？
RQ4敵対的な例での訓練は頑健性を向上させるか、またどのような条件下で？

主な発見

モデル	Original (F1)	AddSent (F1)	AddOneSent (F1)	AddAny (F1)	AddCommon (F1)
単一マッチ	71.4	27.3	39.0	7.6	38.9
アンサンブル一致	75.4	29.4	41.8	11.7	51.0
BiDAF 単体	75.5	34.3	45.7	4.8	41.7
BiDAF アンサンブル	80.0	34.2	46.9	2.7	52.6

敵対的摂動はモデルの性能を著しく低下させる。AddSent では平均 F1 が ~75% から ~36% に、文法的でない AddAny 型入力では ~7% に低下。
評価対象の16モデルはすべて脆弱。モデル間で敵対的例の移行性が一部あり、特に AddSent で顕著。
人間は AddSent でモデルよりはるかに頑健。AddOneSent では人間の低下が小さい。
敵対的データでの訓練は頑健性の向上を限定的にし、変更された敵対者（AddSentMod）へはしばしば移行が悪い。
敵対的例は多くの失敗でモデルに敵対的文中のスパンを予測させる傾向があり、意味を変える編集への過度な安定性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。