QUICK REVIEW

[论文解读] Iterative Refinement for Machine Translation

Roman Novak, Michael Auli|arXiv (Cornell University)|Oct 20, 2016

Natural Language Processing Techniques参考文献 15被引用 22

一句话总结

本文提出了一种神经机器翻译的迭代精炼框架，通过卷积神经网络对源序列和目标序列进行双重注意力，实现对初始翻译的针对性词替换。该方法在WMT15德语-英语翻译任务中将BLEU分数最高提升0.4，同时每句平均仅修改0.6个词，表明仅通过最小化、迭代式的修改即可显著提升翻译质量，且无需使用后编辑的平行语料。

ABSTRACT

Existing machine translation decoding algorithms generate translations in a strictly monotonic fashion and never revisit previous decisions. As a result, earlier mistakes cannot be corrected at a later stage. In this paper, we present a translation scheme that starts from an initial guess and then makes iterative improvements that may revisit previous decisions. We parameterize our model as a convolutional neural network that predicts discrete substitutions to an existing translation based on an attention mechanism over both the source sentence as well as the current translation output. By making less than one modification per sentence, we improve the output of a phrase-based translation system by up to 0.4 BLEU on WMT15 German-English translation.

研究动机与目标

解决现有解码算法无法回溯或纠正早期错误决策的局限性。
开发一种通过词替换方式迭代修正翻译错误的方法，基于初始翻译猜测进行优化。
通过仅在平行单语句对和基线系统输出上进行训练，减少对稀缺后编辑平行语料的依赖。
评估置信度估计和替换启发式方法在实现最小化修改下提升翻译质量的有效性。
探索双重注意力机制在同时关注源序列和当前翻译序列的基础上，提升翻译精炼效果的潜力。

提出的方法

该模型使用卷积神经网络，基于对源句和当前翻译输出的注意力机制，预测目标翻译中的词替换。
双重注意力机制计算源词与当前翻译中目标词之间的对齐得分，实现上下文感知的替换预测。
替换操作以迭代方式进行，每轮均基于置信度选择策略或启发式方法对前一轮翻译进行优化。
模型通过交叉熵损失进行训练，采用二值监督信号判断某个词是否出现在参考译文中。
推理阶段，模型为每个词选择最佳替换，并仅在BLEU得分提升时应用该替换，使用置信度阈值或基于启发式的筛选策略。
该方法以短语基于翻译系统输出作为初始猜测，持续应用精炼直至无法进一步提升BLEU。

实验结果

研究问题

RQ1迭代词替换是否能在不依赖后编辑平行语料的情况下提升翻译质量？
RQ2双重注意力机制在识别并纠正初始翻译错误方面的有效性如何？
RQ3在每句替换少于一个词的极小修改下，BLEU分数能提升多少？
RQ4置信度估计如何影响迭代精炼在翻译中的成功程度？
RQ5仅在平行单语句对和基线输出上进行训练的模型，能否通过精炼实现显著性能提升？

主要发现

该迭代精炼方法在WMT15德语-英语翻译任务中将翻译质量最高提升0.4 BLEU，证明了极小修改即可带来显著增益。
平均每个句子仅进行0.6次词替换，表明错误纠正具有很高的效率。
双重注意力模型在采用置信度选择策略时表现强劲，其性能几乎与拥有参考译文访问权限的“理想模型”相当。
即使采用简单的置信度启发式方法，其表现也几乎与更复杂的筛选方法相当，表明高置信度预测已足够实现有效精炼。
完整理想模型（仅在提升BLEU时选择替换）实现+1.7 BLEU的提升，表明高质量替换在合理选择策略下完全可行。
部分理想模型（可拒绝有害替换）实现+1.09 BLEU的提升，表明置信度估计在避免性能退化方面至关重要。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。