Skip to main content
QUICK REVIEW

[논문 리뷰] Revisiting the Primacy of English in Zero-shot Cross-lingual Transfer

Iulia Turc, Kenton Lee|arXiv (Cornell University)|2021. 06. 30.
Topic Modeling참고 문헌 25인용 수 37
한 줄 요약

본 논문은 영어가 항상 제로샷 교차언어 전이의 최적의 전달 언어가 아닐 수 있음을 보인다; 독일어와 러시아어가 다양한 목표 언어들에서 더 효과적으로 전이되는 경우가 많으며, 영어 학습 데이터를 더 나은 소스 언어로 번역하면 제로샷 성능이 향상될 수 있다.

ABSTRACT

Despite their success, large pre-trained multilingual models have not completely alleviated the need for labeled data, which is cumbersome to collect for all target languages. Zero-shot cross-lingual transfer is emerging as a practical solution: pre-trained models later fine-tuned on one transfer language exhibit surprising performance when tested on many target languages. English is the dominant source language for transfer, as reinforced by popular zero-shot benchmarks. However, this default choice has not been systematically vetted. In our study, we compare English against other transfer languages for fine-tuning, on two pre-trained multilingual models (mBERT and mT5) and multiple classification and question answering tasks. We find that other high-resource languages such as German and Russian often transfer more effectively, especially when the set of target languages is diverse or unknown a priori. Unexpectedly, this can be true even when the training sets were automatically translated from English. This finding can have immediate impact on multilingual zero-shot systems, and should inform future benchmark designs.

연구 동기 및 목표

  • 제로샷 교차언어 전이에서 영어를 넘어 전달 언어 효과를 평가하도록 동기를 부여한다.
  • 다국어 모델을 사용하여 비영어 소스 언어가 다양한 대상 언어로 어떻게 전이되는지를 정량화한다.
  • 영어에서 기계번역된 학습 데이터가 영어 기반의 전이보다 나을지 혹은 동등한지 평가한다.
  • 다국어 NLP에서 데이터 수집 및 벤치마크 설계에 대한 실행 가능한 지침을 제공한다.

제안 방법

  • 소스 S와 대상 T를 비교하여 제로샷 전이 가능도 지표를 정의한다. Z(S→T) = E(M^S, T) / E(M^T, T)로 상대 능력을 사용한다.
  • 대상 집합 L에 대해 Z(S→L) = (1/|L|) Σ_T∈L Z(S→T)로 전이 가능성을 집계한다.
  • 두 개의 사전학습 다중언어 모델(mBERT와 mT5-base)을 분류 및 QA 과제에 대해 실험한다.
  • 단일 소스 언어에서의 단일언어 미세조정monolingual fine-tuning을 사용한 후, 여러 대상에서 제로샷 성능을 평가한다.
  • 번역 효과를 평가하기 위해 영어 기원 학습 데이터를 기계 번역된 변형과 비교하여 데이터 품질을 통제한다.

실험 결과

연구 질문

  • RQ1영어가 다양한 대상 언어에 대한 제로샷 교차언어 전이에서 가장 효과적인 소스 언어인가?
  • RQ2표준 벤치마크(XNLI, PAWS-X, XQuAD, TyDi QA)에서 어떤 비영어 소스 언어들이 더 강한 교차언어 전이를 제공하는가?
  • RQ3영어 학습 데이터를 다른 언어로 번역하는 것이 영어로 직접 학습하는 것보다 제로샷 전이를 향상시키는가?
  • RQ4태스크 전반에서 인코더 전용 모델(mBERT)과 인코더-디코더 모델(mT5) 간 결과에 차이가 있는가?
  • RQ5목표 언어가 서로 다른 문자 체계와 언어 계통을 포괄할 때 전이 성능은 어떻게 달라지는가?

주요 결과

  • 독일어와 러시아어가 XNLI와 PAWS-X 전이 소스로서 영어를 자주 능가한다.
  • 제로샷 우위가 영어에 비해 여러 비영어 소스에서 관찰되며, 예를 들어 de MT와 ru MT가 평균적으로 양의 이점을 보인다.
  • 영어 학습 데이터를 더 강한 소스(예: 독일어나 러시아어)로 번역하면 제로샷 전이가 향상될 수 있으며, MT 데이터를 사용할 때도 해당된다.
  • mT5를 이용한 QA 과제에서 영어가 가장 강한 소스가 될 수 있지만, 독일어/러시아어의 전이는 특정 대상(예: 태국)에 여전히 혜택을 준다.
  • mBERT는 일반적으로 최고의 소스와 최악의 소스 간 격차가 mT5보다 크며, 사전학습 규모와 전략이 전이 역학에 영향을 준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.