Skip to main content
QUICK REVIEW

[논문 리뷰] Robust Neural Machine Translation with Doubly Adversarial Inputs

Yong Cheng, Lu Jiang|arXiv (Cornell University)|2019. 06. 06.
Adversarial Robustness in Machine Learning참고 문헌 30인용 수 37
한 줄 요약

이 논문은 AdvGen을 도입하여 NMT를 위한 이중 적대적 입력을 생성하고, 적대적 소스와 방어적 목적의 적대적 타깃으로 공격하여 중국어–영어 및 영어–독일어 작업에서 번역 품질과 강건성을 향상시킵니다.

ABSTRACT

Neural machine translation (NMT) often suffers from the vulnerability to noisy perturbations in the input. We propose an approach to improving the robustness of NMT models, which consists of two parts: (1) attack the translation model with adversarial source examples; (2) defend the translation model with adversarial target inputs to improve its robustness against the adversarial source inputs.For the generation of adversarial inputs, we propose a gradient-based method to craft adversarial examples informed by the translation loss over the clean inputs.Experimental results on Chinese-English and English-German translation tasks demonstrate that our approach achieves significant improvements ($2.8$ and $1.6$ BLEU points) over Transformer on standard clean benchmarks as well as exhibiting higher robustness on noisy data.

연구 동기 및 목표

  • 작은 입력 변화에 대한 NMT의 취약성을 동기 부여하고 해결합니다.
  • NMT를 위한 적대적 입력을 생성하는 화이트박스, 그래디언트 기반 방법을 제안합니다.
  • 강건성 향상을 위한 타깃 입력의 적대적 방어 메커니즘을 도입합니다.
  • 깨끗한 데이터, 강건성, 언어 모델 주도 구성 요소를 포함하는 결합 목표로 NMT 모델을 학습합니다.
  • 표준 벤치마크에서 Transformer 대비 개선과 노이즈 데이터에서의 강건성 향상을 시연합니다.

제안 방법

  • 번역 손실에 의해 안내되는 그래디언트 기반의 AdvGen을 개발합니다.
  • Perturbation 제약 하에서 -log P(y|x'; θ_mt)를 최대화하는 적대적 소스 입력 x'를 생성하여 인코더를 공격합니다.
  • 소스 언어 모델 Q_src에서 파생된 상위 n 개 후보 단어 집합을 통해 후보 대체를 선택합니다.
  • 대상 후보 집합 Q_trg와 주의(attention) 정보를 활용한 샘플링 D_trg를 통해 디코더를 위한 적대적 타깃 입력 z'를 생성하여 방어합니다.
  • 변형된 쌍 (x', z')를 사용하여 강건성 손실을 계산하고 이를 깨끗한 언어 모델 기반 손실과 결합하여 최종 목표를 형성합니다.
  • 네 가지 손실 구성요소로 학습합니다: L_clean, L_robust, 소스 언어 모델용 두 개의 L_lm 항(MT 모델과 임베딩 공유).

실험 결과

연구 질문

  • RQ1화이트박스 그래디언트 기반 방법이 과도한 섭 perturb 없이 NMT를 효과적으로 공격용 입력으로 생성할 수 있는가.
  • RQ2훈련 중 적대적 타깃 입력이 소스 입력의 섭 perturb에 대한 강건성을 향상시킬 수 있는가.
  • RQ3이중 적대적 입력으로의 학습이 깨끗한 데이터에서 표준 Transformer 대비 향상을 가져오고 노이즈가 있는 데이터에서 강건성을 유지하는가.
  • RQ4적대적 구성요소와 언어 모델의 지도가 번역 품질과 안정성에 어떤 영향을 미치는가?

주요 결과

  • 표준 벤치마크에서 Transformer 대비 유의미한 BLEU 향상: 중국어–영어에서 평균 +2.25 BLEU, NIST03에서 최대 +2.8 BLEU.
  • 영어–독일어에서 Trans.-Base 대비 +1.04 BLEU, Trans.-Big 대비 +1.61 BLEU, RNMT+ 대비 +1.52 BLEU의 개선이 나타남.
  • Monolingual 데이터 사용 시 Our + BackTranslation으로 결과가 최대 약 1–3 BLEU 포인트 추가 향상.
  • 타깃 입력 적대적 변화의 기여가 상당한 이득을 가져오며, 언어 모델이 유창성과 후보 후보 축소에 도움을 준다.
  • 강건성 학습을 적용한 모델은 인위적 노이즈 하에서 더 나은 안정성을 유지하고, 노이즈 비율에 따라 기존 기준선보다 우수한 성능을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.