QUICK REVIEW
[논문 리뷰] DRCD: a Chinese Machine Reading Comprehension Dataset
Chih-Chieh Shao, Trois Liu|arXiv (Cornell University)|2018. 06. 04.
Topic Modeling참고 문헌 9인용 수 85
한 줄 요약
본 논문은 DRCD를 도입합니다. 이는 10,014개의 단락과 2,108개의 위키피디아 문서에서 추출한 전통 중국어 MRC 데이터셋과 30k+개의 질문을 포함하며, baseline F1 89.59%와 사람의 F1 93.30%를 제시합니다.
ABSTRACT
In this paper, we introduce DRCD (Delta Reading Comprehension Dataset), an open domain traditional Chinese machine reading comprehension (MRC) dataset. This dataset aimed to be a standard Chinese machine reading comprehension dataset, which can be a source dataset in transfer learning. The dataset contains 10,014 paragraphs from 2,108 Wikipedia articles and 30,000+ questions generated by annotators. We build a baseline model that achieves an F1 score of 89.59%. F1 score of Human performance is 93.30%.
연구 동기 및 목표
- 전이 학습을 위한 표준 중국어 기계 독해 데이터셋을 제공한다.
- 벤치마킹을 위한 대규모의 오픈 도메인 전통 중국어 MRC 자원을 제공한다.
- 현실적인 단락과 질문의 혼합으로 중국어 MRC에서 모델 평가를 가능하게 한다.
제안 방법
- 오픈 도메인 소스에서 전통 중국어 MRC 데이터를 수집하고 주석을 다는 것.
- 10,014개의 단락을 2,108개의 위키피디아 기사에서 모으고 30,000+개의 질문을 구성한다.
- F1를 벤치마크하고 인간 성능과 비교하기 위한 기준 모델을 설정한다.
- 데이터셋에서 Baseline F1 점수 89.59%와 인간 성능 93.30%를 보고한다.
실험 결과
연구 질문
- RQ1DRCD의 전통 중국어 MRC에 대해 기본 모델이 얼마나 잘 수행할 수 있는가?
- RQ2DRCD에서 모델 성능과 인간 성능 사이의 차이는 어느 정도인가?
- RQ3DRCD가 중국어 MRC의 전이 학습에 효과적인 소스 데이터셋이 될 수 있는가?
- RQ4크기와 원천 다양성 측면에서 DRCD 데이터셋의 특징은 무엇인가?
주요 결과
- Baseline 모델은 F1 점수 89.59%를 달성한다.
- DRCD에서의 인간 성능은 F1 점수 93.30%를 산출한다.
- 데이터셋은 10,014개의 단락으로 구성되며 2,108개의 위키피디아 기사에서 30,000+개의 질문을 포함한다.
- DRCD는 벤치마킹 및 전이 학습에 적합한 오픈 도메인 전통 중국어 MRC 자원으로서 작용한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.