Skip to main content
QUICK REVIEW

[论文解读] DRCD: a Chinese Machine Reading Comprehension Dataset

Chih-Chieh Shao, Trois Liu|arXiv (Cornell University)|Jun 4, 2018
Topic Modeling参考文献 9被引用 85
一句话总结

本文介绍 DRCD,这是一个传统中文机器阅读理解数据集,包含来自 2,108 篇维基百科文章的 10,014 段落以及 30k+ 个问题,基线 F1 为 89.59%,人工 F1 为 93.30%。

ABSTRACT

In this paper, we introduce DRCD (Delta Reading Comprehension Dataset), an open domain traditional Chinese machine reading comprehension (MRC) dataset. This dataset aimed to be a standard Chinese machine reading comprehension dataset, which can be a source dataset in transfer learning. The dataset contains 10,014 paragraphs from 2,108 Wikipedia articles and 30,000+ questions generated by annotators. We build a baseline model that achieves an F1 score of 89.59%. F1 score of Human performance is 93.30%.

研究动机与目标

  • 提供用于迁移学习的标准中文机器阅读理解数据集。
  • 提供一个大型、开放领域的传统中文机器阅读理解资源用于基准测试。
  • 使在中文机器阅读理解上评估模型时,能够使用真实的段落与问题混合来进行。

提出的方法

  • 从开放领域来源收集并标注传统中文机器阅读理解数据。
  • 汇集来自 2,108 篇维基百科文章的 10,014 段落和 30,000+ 个问题。
  • 建立基线模型以基准 F1 并与人工表现进行比较。
  • 在该数据集上报告基线 F1 分数为 89.59% 和人工表现为 93.30%。

实验结果

研究问题

  • RQ1基线模型在 DRCD 的传统中文机器阅读理解任务上能达到多好的表现?
  • RQ2DRCD 上模型表现与人工表现之间的差距有多大?
  • RQ3DRCD 能否作为中文机器阅读理解迁移学习的有效源数据集?
  • RQ4就数据集的规模与来源多样性而言,DRCD 的特征是什么?

主要发现

  • 基线模型实现了 89.59% 的 F1 分数。
  • 在 DRCD 上的人类表现达到 93.30% 的 F1 分数。
  • 该数据集包含来自 2,108 篇维基百科文章的 10,014 段落以及 30,000+ 个问题。
  • DRCD 作为一个面向开放领域的传统中文机器阅读理解资源,适用于基准测试和迁移学习。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。