Skip to main content
QUICK REVIEW

[論文レビュー] DRCD: a Chinese Machine Reading Comprehension Dataset

Chih-Chieh Shao, Trois Liu|arXiv (Cornell University)|Jun 4, 2018
Topic Modeling参考文献 9被引用数 85
ひとこと要約

本論文は DRCD を紹介します。伝統的中国語の MRC データセットは、2,108 の Wikipedia 記事から 10,014 の段落と 30k+ の質問を提供し、ベースライン F1 は 89.59%、人間 F1 は 93.30% です。

ABSTRACT

In this paper, we introduce DRCD (Delta Reading Comprehension Dataset), an open domain traditional Chinese machine reading comprehension (MRC) dataset. This dataset aimed to be a standard Chinese machine reading comprehension dataset, which can be a source dataset in transfer learning. The dataset contains 10,014 paragraphs from 2,108 Wikipedia articles and 30,000+ questions generated by annotators. We build a baseline model that achieves an F1 score of 89.59%. F1 score of Human performance is 93.30%.

研究の動機と目的

  • 転移学習のための標準的な中国語機械読解データセットを提供する。
  • 大規模でオープンドメインの伝統的中国語 MRC リソースをベンチマーク用に提供する。
  • 現実的な段落と質問の混合を用いて中国語 MRC のモデルを評価できるようにする。

提案手法

  • オープンドメインの情報源から伝統的中国語の MRC データを収集し、注釈を付ける。
  • 10,014 の段落を 2,108 の Wikipedia 記事から、30,000+ の質問を組み立てる。
  • F1 をベンチマークし、人間の性能と比較するためのベースラインモデルを確立する。
  • データセットでのベースライン F1 スコア 89.59%、人間の性能 93.30% を報告する。

実験結果

リサーチクエスチョン

  • RQ1DRCD における伝統的中国語 MRC のベースラインモデルはどれくらいの性能を発揮できるか。
  • RQ2DRCD におけるモデル性能と人間の性能のギャップはどれくらいか。
  • RQ3DRCD は中国語 MRC の転移学習の有効なソースデータセットとなり得るか。
  • RQ4サイズと出典の多様性の観点から DRCD データセットの特徴は何か。

主な発見

  • ベースラインモデルは F1 スコア 89.59% を達成します。
  • DRCD における人間の性能は F1 スコア 93.30% です。
  • データセットは 10,014 の段落を 2,108 の Wikipedia 記事から、30,000+ の質問から構成されています。
  • DRCD はベンチマークと転移学習に適したオープンドメインの伝統的中国語 MRC リソースとして機能します。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。