QUICK REVIEW
[论文解读] DRCD: a Chinese Machine Reading Comprehension Dataset
Chih-Chieh Shao, Trois Liu|arXiv (Cornell University)|Jun 4, 2018
Topic Modeling参考文献 9被引用 85
一句话总结
本文介绍 DRCD,这是一个传统中文机器阅读理解数据集,包含来自 2,108 篇维基百科文章的 10,014 段落以及 30k+ 个问题,基线 F1 为 89.59%,人工 F1 为 93.30%。
ABSTRACT
In this paper, we introduce DRCD (Delta Reading Comprehension Dataset), an open domain traditional Chinese machine reading comprehension (MRC) dataset. This dataset aimed to be a standard Chinese machine reading comprehension dataset, which can be a source dataset in transfer learning. The dataset contains 10,014 paragraphs from 2,108 Wikipedia articles and 30,000+ questions generated by annotators. We build a baseline model that achieves an F1 score of 89.59%. F1 score of Human performance is 93.30%.
研究动机与目标
- 提供用于迁移学习的标准中文机器阅读理解数据集。
- 提供一个大型、开放领域的传统中文机器阅读理解资源用于基准测试。
- 使在中文机器阅读理解上评估模型时,能够使用真实的段落与问题混合来进行。
提出的方法
- 从开放领域来源收集并标注传统中文机器阅读理解数据。
- 汇集来自 2,108 篇维基百科文章的 10,014 段落和 30,000+ 个问题。
- 建立基线模型以基准 F1 并与人工表现进行比较。
- 在该数据集上报告基线 F1 分数为 89.59% 和人工表现为 93.30%。
实验结果
研究问题
- RQ1基线模型在 DRCD 的传统中文机器阅读理解任务上能达到多好的表现?
- RQ2DRCD 上模型表现与人工表现之间的差距有多大?
- RQ3DRCD 能否作为中文机器阅读理解迁移学习的有效源数据集?
- RQ4就数据集的规模与来源多样性而言,DRCD 的特征是什么?
主要发现
- 基线模型实现了 89.59% 的 F1 分数。
- 在 DRCD 上的人类表现达到 93.30% 的 F1 分数。
- 该数据集包含来自 2,108 篇维基百科文章的 10,014 段落以及 30,000+ 个问题。
- DRCD 作为一个面向开放领域的传统中文机器阅读理解资源,适用于基准测试和迁移学习。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。