QUICK REVIEW

[논문 리뷰] DRCD: a Chinese Machine Reading Comprehension Dataset

Chih-Chieh Shao, Trois Liu|arXiv (Cornell University)|2018. 06. 04.

Topic Modeling참고 문헌 9인용 수 85

한 줄 요약

본 논문은 DRCD를 도입합니다. 이는 10,014개의 단락과 2,108개의 위키피디아 문서에서 추출한 전통 중국어 MRC 데이터셋과 30k+개의 질문을 포함하며, baseline F1 89.59%와 사람의 F1 93.30%를 제시합니다.

ABSTRACT

In this paper, we introduce DRCD (Delta Reading Comprehension Dataset), an open domain traditional Chinese machine reading comprehension (MRC) dataset. This dataset aimed to be a standard Chinese machine reading comprehension dataset, which can be a source dataset in transfer learning. The dataset contains 10,014 paragraphs from 2,108 Wikipedia articles and 30,000+ questions generated by annotators. We build a baseline model that achieves an F1 score of 89.59%. F1 score of Human performance is 93.30%.

연구 동기 및 목표

전이 학습을 위한 표준 중국어 기계 독해 데이터셋을 제공한다.
벤치마킹을 위한 대규모의 오픈 도메인 전통 중국어 MRC 자원을 제공한다.
현실적인 단락과 질문의 혼합으로 중국어 MRC에서 모델 평가를 가능하게 한다.

제안 방법

오픈 도메인 소스에서 전통 중국어 MRC 데이터를 수집하고 주석을 다는 것.
10,014개의 단락을 2,108개의 위키피디아 기사에서 모으고 30,000+개의 질문을 구성한다.
F1를 벤치마크하고 인간 성능과 비교하기 위한 기준 모델을 설정한다.
데이터셋에서 Baseline F1 점수 89.59%와 인간 성능 93.30%를 보고한다.

실험 결과

연구 질문

RQ1DRCD의 전통 중국어 MRC에 대해 기본 모델이 얼마나 잘 수행할 수 있는가?
RQ2DRCD에서 모델 성능과 인간 성능 사이의 차이는 어느 정도인가?
RQ3DRCD가 중국어 MRC의 전이 학습에 효과적인 소스 데이터셋이 될 수 있는가?
RQ4크기와 원천 다양성 측면에서 DRCD 데이터셋의 특징은 무엇인가?

주요 결과

Baseline 모델은 F1 점수 89.59%를 달성한다.
DRCD에서의 인간 성능은 F1 점수 93.30%를 산출한다.
데이터셋은 10,014개의 단락으로 구성되며 2,108개의 위키피디아 기사에서 30,000+개의 질문을 포함한다.
DRCD는 벤치마킹 및 전이 학습에 적합한 오픈 도메인 전통 중국어 MRC 자원으로서 작용한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.