Skip to main content
QUICK REVIEW

[논문 리뷰] Multi-Criteria Chinese Word Segmentation with Transformer

Xipeng Qiu, Hengzhi Pei|arXiv (Cornell University)|2019. 06. 28.
Natural Language Processing Techniques참고 문헌 20인용 수 10
한 줄 요약

이 논문은 기준 지표 토큰에 조건화된 공유 완전 연결 자기주의 메커니즘을 활용하는 통합 Transformer 기반 모델을 제안한다. 이는 다양한 분할 기준을 가진 여덟 개의 CWS 데이터셋을 동시에 학습하여, 단일 기준 접근 방식에 비해 모든 코퍼스에서 상당한 성능 향상을 달성한다.

ABSTRACT

Different linguistic perspectives cause many diverse segmentation criteria for Chinese word segmentation (CWS). Most existing methods focus on improving the performance of single-criterion CWS. However, it is interesting to exploit these heterogeneous segmentation criteria and mine their common underlying knowledge. In this paper, we propose a concise and effective model for multi-criteria CWS, which utilizes a shared fully-connected self-attention model to segment the sentence according to a criterion indicator. Experiments on eight datasets with heterogeneous segmentation criteria show that the performance of each corpus obtains a significant improvement, compared to single-criterion learning.

연구 동기 및 목표

  • 다양한 언어적 시각에서 중국어 어절 분할(CWS)의 일관되지 않은 분할 기준 문제를 해결하기 위해.
  • 이질적인 CWS 기준 간의 공통된 지식을 탐색하여 전체 분할 성능을 향상시키기 위해.
  • 여러 분할 기준을 동시에 효과적으로 처리할 수 있는 단일 통합 모델을 개발하기 위해.
  • 다기준 학습을 통해 기존의 단일 기준 CWS 방법을 뛰어넘기 위해.

제안 방법

  • 입력 문장을 처리하기 위해 공유된 완전 연결 자기주의 메커니즘이 사용되며, 분할 기준은 기준 지표 토큰을 통해 나타낸다.
  • 각각 다른 언어적 분할 표준을 반영하는 여러 CWS 데이터셋에서 엔드 투 엔드로 모델을 훈련시킨다.
  • 기준 지표가 자기주의 메커니즘의 적응을 통해 특정 언어 규칙이나 표준에 맞게 분할 출력을 조정하도록 이끈다.
  • 아키텍처는 다양한 기준 간의 파라미터 공유를 가능하게 하여 지식 전이와 모델 효율성을 증진시킨다.
  • 훈련 중에 모든 분할 기준을 동시에 최적화함으로써 일반화 능력과 성능을 향상시킨다.

실험 결과

연구 질문

  • RQ1통합 딥 러닝 모델이 다양한 이질적인 중국어 어절 분할 기준을 효과적으로 처리할 수 있는가?
  • RQ2단일 기준 학습에 비해 다기준 학습을 통해 달성할 수 있는 성능 향상은 어느 정도인가?
  • RQ3기준 간 공유된 주의 메커니즘이 더 나은 일반화와 향상된 분할 정확도를 이끌어내는가?
  • RQ4재학습 없이도 다양한 언어적 기준에서 뛰어난 성능을 달성할 수 있는 단일 모델이 가능한가?

주요 결과

  • 제안된 모델은 단일 기준 학습 기반 모델에 비해 여덟 개의 CWS 데이터셋 모두에서 상당한 성능 향상을 달성한다.
  • 다양한 언어적 기준에서 다기준 학습은 더 나은 일반화 능력과 향상된 분할 정확도를 이끌어낸다.
  • 기준 지표와 공유된 자기주의를 활용하면 단일 아키텍처 내에서 다양한 분할 규칙에 효과적으로 적응할 수 있다.
  • 모델는 뛰어난 이식성과 이질적인 CWS 코퍼스 전반에서 높은 성능을 유지함을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.