Skip to main content
QUICK REVIEW

[논문 리뷰] Fine-tuning Large Language Models for Domain-specific Machine Translation

Jiawei Zheng, Hanghai Hong|arXiv (Cornell University)|2024. 02. 23.
Natural Language Processing Techniques인용 수 9
한 줄 요약

논문은 LoRA를 이용한 프롬프트 지향 미세조정 방법으로 일반 목적 LLM(Llama2-7B)을 도메인 특화 기계 번역에 적합하게 조정하고, 도메인 어휘 프롬프트와 혼합 도메인 데이터를 활용해 제로샷 MT 능력을 유지합니다.

ABSTRACT

Large language models (LLMs) have shown great potential in domain-specific machine translation (MT). However, one major issue is that LLMs pre-trained on general domain corpus might not generalize well to specific domains due to the lack of domain-specific knowledge. To address this issue, this paper focuses on enhancing the domain-specific MT capability of LLMs, by providing high-quality training datasets and proposing a novel fine-tuning framework denoted by DragFT. DragFT augments LLMs via three techniques: (i) Dictionary-enhanced prompting integrates dictionary information into prompts to improve the translation of domain-specific terminology.; (ii) RAG-based few-shot example selection provides high-quality examples that simulate both the domain and style characteristics; (iii) Fine-tuning with few-shot examples further enhances performance when using in-domain examples. We deploy DragFT on three well-known LLM backbones with 13B training parameters to validate its effectiveness. The results on three domain-specific datasets show that DragFT achieves a significant performance boost and shows superior performance compared to advanced models such as GPT-3.5 and GPT-4o. The drastic performance improvement of DragFT over existing LLMs can be attributed to incorporating relevant knowledge while mitigating noise.

연구 동기 및 목표

  • 맥락 기반 학습의 비효율성과 미세조정으로 인한 과도한 특화 문제를 해결함으로써 도메인 특화 MT의 개선을 목표로 한다.
  • 자연어 번역 지시를 활용한 경량의 미세조정 접근법(LoRA)을 제시한다.
  • 드문 단어 번역 강화를 위해 자체 구성 IT 도메인 데이터셋과 도메인 어휘를 활용한다.
  • 혼합 도메인 학습이 제로샷 MT 능력을 보존하면서 도메인 특화 MT를 향상시키는지 입증한다.
  • 도메인 용어에 대한 사전 기반 프롬프트가 도메인 용어 처리에서 체인-사전 프롬프트보다 우수하다는 것을 보인다.

제안 방법

  • 중국어-영어 IT 문서를 정렬하여 IT 도메인의 이중언어 데이터셋을 생성하고 제로샷 번역기와의 검증을 통해 데이터의 품질을 확보한다.
  • 영어로 된 번역 작업 지시 및 설명을 생성하고 이 데이터셋에서 LoRA로 미세조정하여 추론 시 제로샷 번역이 가능하도록 한다.
  • 사전 기반 프롬프트(Dictionary-Rephrasing 및 Chain-of-Dictionary 변형)를 통해 대형 IT 이중언어 사전을 활용하여 도메인 어휘를 보강한다.
  • 도메인 특화 데이터와 일반 도메인 데이터를 결합한 최종 혼합 도메인 데이터셋을 구성하여 제로샷 MT 능력을 회복하고 과도한 특화를 방지한다.
  • MT 프롬프트의 가장 효과적인 영어 지시 스타일을 식별하기 위해 프롬 prompting 템플릿을 평가한다.
  • LoRA와 같은 매개변수 효율적 미세조정과 전체 미세조정을 비교하여 학습 효율성을 평가한다.

실험 결과

연구 질문

  • RQ1프롬프트 지향 미세조정이 제로샷 예시나 맥락 예시 의존 없이도 도메인 특화 MT를 개선할 수 있는가?
  • RQ2도메인 특화 어휘를 사전 기반 프롬 prompting으로 도입하면 희귀 도메인 용어 번역이 향상되는가?
  • RQ3도메인 특화 데이터와 일반 도메인 데이터를 혼합해 학습하면 제로샷 MT 능력이 보전되면서 도메인 MT가 향상되는가?
  • RQ4번역 지시 템플릿이 MT 성능에 미치는 영향은 무엇인가?

주요 결과

모델Flores-101 BLEUFlores-101 COMETOPUS-100 BLEUOPUS-100 COMETIT BLEUIT COMETXFIT24 BLEUXFIT24 COMET
Llama2-7B †25.3849.9024.99-28.9322.7232.79--
LlamaIT †22.04 (↓3.34)45.49 (↓4.41)35.91 (↑10.92)61.97 (↑90.90)55.16 (↑32.44)89.24 (↑56.45)--
Llama2-7B ‡33.4955.1827.545.3633.2664.67--
LlamaIT ‡32.60 (↓0.89)53.98 (↓1.2)37.79 (↑10.25)72.98 (↑67.62)63.76 (↑30.50)101.71 (↑37.04)--
  • 프롬프트 지향 미세조정(LlamaIT)은 IT 도메인 번역 작업에서 기본 LLM 대비 도메인 특화 MT를 상당히 향상시킨다.
  • 사전 기반 프롬 prompting(Dictionary-Rephrasing)은 도메인 용어 처리에서 체인-오브-디시셔너리 프롬 prompting보다 우수하다.
  • LoRA를 이용한 미세조정은 전체 미세조정에 비해 훨씬 적은 매개변수로 도메인 MT에서 큰 향상을 달성하고 학습 시간도 감소한다.
  • 혼합 도메인 학습은 일반 도메인에서의 제로샷 MT 능력을 회복하는 한편 도메인 MT 성능을 유지한다.
  • 영어 지시 템플릿을 사용한 제로샷 프롬 prompting이 평가된 템플릿 중에서 평균 MT 성능이 가장 좋다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.