Skip to main content
QUICK REVIEW

[論文レビュー] Pre-Translation for Neural Machine Translation

Jan Niehues, Eunah Cho|arXiv (Cornell University)|Oct 17, 2016
Natural Language Processing Techniques参考文献 21被引用数 67
ひとこと要約

本稿では、ニューラル機械翻訳(NMT)のための前処理翻訳(PreMT)を提案する。まず、フレーズベースMT(PBMT)システムが元の入力をターゲット言語に翻訳し、その後、NMTモデルが元のソースとPBMTの出力を両方の入力として用いて最終的な翻訳を生成する。この手法により、ベースラインNMTおよびPBMTシステムに比べて翻訳品質が最大2 BLEUポイント向上し、特に希少語や語彙素性が複雑な語に顕著に効果を発揮する。

ABSTRACT

Recently, the development of neural machine translation (NMT) has significantly improved the translation quality of automatic machine translation. While most sentences are more accurate and fluent than translations by statistical machine translation (SMT)-based systems, in some cases, the NMT system produces translations that have a completely different meaning. This is especially the case when rare words occur. When using statistical machine translation, it has already been shown that significant gains can be achieved by simplifying the input in a preprocessing step. A commonly used example is the pre-reordering approach. In this work, we used phrase-based machine translation to pre-translate the input into the target language. Then a neural machine translation system generates the final hypothesis using the pre-translation. Thereby, we use either only the output of the phrase-based machine translation (PBMT) system or a combination of the PBMT output and the source sentence. We evaluate the technique on the English to German translation task. Using this approach we are able to outperform the PBMT system as well as the baseline neural MT system by up to 2 BLEU points. We analyzed the influence of the quality of the initial system on the final result.

研究の動機と目的

  • NMTシステムが希少語や語彙外語(OOV)に対して誤った翻訳を生成する問題、例えばドイツ語で「goalie」が「Gott」(神)に誤訳されるのを是正すること。
  • PBMTが希少語を扱う強みを活かしつつ、NMTの滑らかさと文法的正確性を維持すること。
  • PBMTの出力と元のソースをNMTモデルの入力として組み合わせることで、全体的な翻訳品質を向上させること。
  • BPEサービントークン化が意味的整合性を損なう場合に、PBMTによる前処理翻訳がNMT性能を向上させるかどうかを調査すること。

提案手法

  • フレーズベースMT(PBMT)システムを用いて、元の文をターゲット言語に前処理翻訳する。
  • NMTモデルは、元のソース文とPBMTによる前処理翻訳を連結した入力系列に条件づけられる。
  • NMTモデルは、元のソースと前処理翻訳の両方を用いて最終的な翻訳を生成し、希少語の形態的完全なターゲット言語表現にアクセスできるようにする。
  • NMTモデルのアテンション機構を分析し、サブワードトークン化された語や希少語に対して、前処理翻訳入力に注目が集中していることを示す。
  • NMTにおける語彙サイズの制限のためにBPEを用いるが、前処理翻訳を意味的基準として提供することでその負の影響を緩和する。
  • 本手法は、英語→ドイツ語翻訳タスクにおいて、PBMT、NMT、アンサンブルシステムと比較してBLEUスコアで評価される。

実験結果

リサーチクエスチョン

  • RQ1フレーズベースMTシステムによる前処理翻訳が、特に希少語や語彙外語に対して、ニューラルMTシステムの翻訳品質を向上させることができるか。
  • RQ2元のソース文とPBMTによる前処理翻訳を組み合わせることで、NMTモデルの正確で滑らかな翻訳生成能力にどのような影響を与えるか。
  • RQ3PBMTによる前処理翻訳の品質が、PreMTシステムの最終的性能にどの程度影響を与えるか。
  • RQ4PreMTアプローチは、単体のPBMTおよびNMTシステムに比べて、BLEUスコアおよび希少語の誤り削減の観点で優れているか。

主な発見

  • PreMTシステムは、英語→ドイツ語翻訳タスクにおいて、ベースラインNMTおよびPBMTシステムに最大2 BLEUポイントの優位性を示す。
  • アンサンブルモデルを用いる場合、PreMTシステムはNMTベースラインに比べて1.8 BLEUポイントのスコア向上を達成する。
  • 「goalie」や「parried」のような希少語において、NMTシステム単体では頻繁に誤った翻訳(例:「Torwart」に対して「Gott」)を生成するが、PreMTでは正しく翻訳される。
  • NMTモデルのアテンション機構は、サブワードトークン化された語や希少語に対して、前処理翻訳入力に注目を集中させていることが示され、前処理翻訳が意味的ガイドとして効果的に機能していることが裏付けられる。
  • PBMTシステム単体では希少語の処理においてNMTを上回るが、PreMTはPBMTの語彙的正確性とNMTの滑らかさを組み合わせることで、両者を凌駕する。
  • 本手法はPBMTの品質に頑健である:中程度の品質のPBMTシステムでさえ、NMTベースラインを上回る性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。