Skip to main content
QUICK REVIEW

[논문 리뷰] XLDA: Cross-Lingual Data Augmentation for Natural Language Inference and Question Answering

Jasdeep Singh, Bryan McCann|arXiv (Cornell University)|2019. 05. 27.
Topic Modeling참고 문헌 31인용 수 61
한 줄 요약

XLDA는 학습 중 입력의 일부를 다른 언어로 번역한 것으로 교체하여, 다수의 언어에서 교차 언어 NLI 및 QA 성능을 향상시킨다.

ABSTRACT

While natural language processing systems often focus on a single language, multilingual transfer learning has the potential to improve performance, especially for low-resource languages. We introduce XLDA, cross-lingual data augmentation, a method that replaces a segment of the input text with its translation in another language. XLDA enhances performance of all 14 tested languages of the cross-lingual natural language inference (XNLI) benchmark. With improvements of up to $4.8\%$, training with XLDA achieves state-of-the-art performance for Greek, Turkish, and Urdu. XLDA is in contrast to, and performs markedly better than, a more naive approach that aggregates examples in various languages in a way that each example is solely in one language. On the SQuAD question answering task, we see that XLDA provides a $1.0\%$ performance increase on the English evaluation set. Comprehensive experiments suggest that most languages are effective as cross-lingual augmentors, that XLDA is robust to a wide range of translation quality, and that XLDA is even more effective for randomly initialized models than for pretrained models.

연구 동기 및 목표

  • 저자 주 다국어 전이 학습이 자원 부족 언어의 성능 향상에 기여하도록 동기를 부여한다.
  • 번역된 구간을 사용하여 교차 언어 학습 신호를 생성하는 간단한 데이터 증강 방법을 제안한다.
  • XLDA의 다수의 언어와 과제(XNLI 및 SQuAD)에서의 효과를 입증한다.
  • 번역 품질에 대한 강건성과 사전 학습된 모델과 임의 초기화 모델 모두에 대한 적용 가능성을 제시한다.

제안 방법

  • XLDA를 데이터셋 D에 대해 입력 x 또는 y의 일부를 언어 j로 번역한 것으로 대체하는 것으로 정의하고, D'를 만들며 교차 언어 학습 데이터셋 D_XLDA를 만든다.
  • 단일언어, 비중첩 다국어(DMT), 및 XLDA 학습 설정을 비교한다.
  • Devlin et al. (2018)의 표준 하이퍼파라미터를 사용하여 XNLI 및 SQuAD에서 BERT ML과 LSTM 기본 모델로 XLDA를 평가한다.
  • 여러 MT 시스템의 번역을 사용하여 14개의 XNLI 언어와 SQuAD 학습 번역(영어 맥락/질문이 다중 언어로 번역된 것)에 걸친 교차 언어 증강자를 형성한다.
  • 다중 증강자를 탐욕적으로 선택하여 단일 증강자 대비 성능 이득을 극대화한다.
  • 사전 학습된 모델과 임의 초기화된 모델 모두에서 XLDA의 효과를 보이도록 제거 실험(ablation)을 수행한다.

실험 결과

연구 질문

  • RQ1학습 중 입력의 일부가 다른 언어로 번역될 때 XLDA가 자연어 이해를 향상시키는가?
  • RQ2교차 언어 증강이 XNLI의 모든 언어와 SQuAD에서 성능을 향상시킬 수 있는가?
  • RQ3XLDA가 번역 품질의 편차에 강건하고 사전 학습된 모델과 비사전 학습 모델 모두에서 효과적인가?
  • RQ4XLDA가 분리된 다국어 학습(DMT) 설정 및 역번역(back-translation) 방식과 어떻게 비교되는가?
  • RQ5다중 증강자 사용과 탐욕적 선택이 성능에 미치는 영향은 무엇인가?

주요 결과

  • XLDA는 XNLI에서 단일 언어 학습 대비 모든 대상 언어의 성능을 향상시키며, 최대 4.8% 절대 이득을 달성한다.
  • XLDA는 XNLI에서 그리스어, 터키어, 우르두에 대해 동시 전처리 없이도 최첨단 성과를 달성한다(Lample & Conneau 2019).
  • SQuAD에서 학습 데이터가 추가 언어로 번역될 때 영어 평가 세트의 EM이 1.0% 향상된다.
  • 대부분의 언어가 효과적인 교차 언어 증강자로 작용하며, 우르두는 종종 약한 증강자이고 힌디는 다른 대상에 대해 강한 이득을 제공하는 경향이 있다.
  • 탐욕적 XLDA는 다중 증강자를 결합하여 단일 최상 증강자 및 표준 단일 언어 기준선 대비 일관되게 향상되며, 일부 경우 최대 약 4.9%의 이득을 준다.
  • XLDA는 사전 학습된(BERT ML) 모델과 임의 초기화 모델 모두에 유익하며, LSTM 베이스라인을 사용할 때도 더 잘 수행될 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.