QUICK REVIEW

[論文レビュー] Semi-Autoregressive Training Improves Mask-Predict Decoding

Marjan Ghazvininejad, Omer Levy|arXiv (Cornell University)|Jan 23, 2020

Topic Modeling参考文献 15被引用数 48

ひとこと要約

SMART training は条件付きマスク言語モデルを改善し、マスク-predictデコードの性能を向上させ、自己回帰モデルとの差を大部分縮小し、翻訳品質を向上させる。

ABSTRACT

The recently proposed mask-predict decoding algorithm has narrowed the performance gap between semi-autoregressive machine translation models and the traditional left-to-right approach. We introduce a new training method for conditional masked language models, SMART, which mimics the semi-autoregressive behavior of mask-predict, producing training examples that contain model predictions as part of their inputs. Models trained with SMART produce higher-quality translations when using mask-predict decoding, effectively closing the remaining performance gap with fully autoregressive models.

研究の動機と目的

トレーニングと半自己回帰的マスク予測デコードの不一致を動機づけ、解決する。
トレーニング時の予測ベース入力をより適切に反映するSMARTトレーニングを提案する。
標準的なMTベンチマークでSMARTを評価し、NARTおよび自己回帰ベースラインと比較する。
訓練の選択（例：全トークンの予測、前向きパス）が性能と頑健性にどう影響するかを分析する。

提案手法

金のターゲットシーケンスから開始し、ランダムなサブセットをマスクしてY_goldを作成。
部分的に観測されたY_gold_obsからY_predを予測して全シーケンスを得る。
Y_predから新しいランダムサブセットをマスクして学習入力Y_pred_obsを作成し、金のY_goldを予測するよう訓練する。
観測された予測の誤りを正すことを可能にするため、すべてのトークンに対してクロスエントロピーで訓練する。
任意でマスク-predictの予測ステップを変更して、マスクされたトークンだけでなくすべてのトークンを予測する（頑健性のため）。

実験結果

リサーチクエスチョン

RQ1SMARTトレーニングはマスク-predictデコードを使用した場合、元のNARTトレーニングと比較して翻訳品質を向上させるか。
RQ2標準のMTベンチマークでSMARTトレーニングモデルは完全な自己回帰のベースラインにどれだけ近づくか。
RQ3予測すべき全トークン vs マスクされたトークン、前方パスの数など、どのようなトレーニングの変動性が性能に影響するか。
RQ4SMARTはマスク-predictで言語ペアとデコード反復回数（T）においてどのように性能を示すか。
RQ5学習時の難易度（ゴールドマスキング比）と学習への影響は何か。

主な発見

SMARTはNARTより翻訳BLEUが高く、ベンチマーク間で平均 +0.71 BLEU。
デコード反復回数を10回とすると、SMARTはWMT’14 EN-DEで27.65 BLEUに達し、強力な自己回帰ベースラインの27.75 BLEUに近い。
10反復のマスク-predictでSMARTはWMT’17でDE-EN 31.27、EN-ZH 34.06を達成し、自己回帰の性能に近づいている。
predictステップでSMARTを訓練し、全トークンを予測するようにすると、4回の反復で開発セットに約0.40 BLEUの利得。
反復を増やすと一般に自己回帰モデルとの差が縮まり、一部のベンチマークでは同等またはほぼ同等の性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。