Skip to main content
QUICK REVIEW

[論文レビュー] Deep Learning Based Text Classification: A Comprehensive Review

Shervin Minaee, Nal Kalchbrenner|arXiv (Cornell University)|Apr 6, 2020
Topic Modeling参考文献 229被引用数 389
ひとこと要約

sentiment analysis、QA、NLI などを含むテキスト分類のための150以上の深層学習モデルをレビュー・分析し、40を超えるデータセットと、16のベンチマークに基づく定量的な性能調査を行う。

ABSTRACT

Deep learning based models have surpassed classical machine learning based approaches in various text classification tasks, including sentiment analysis, news categorization, question answering, and natural language inference. In this paper, we provide a comprehensive review of more than 150 deep learning based models for text classification developed in recent years, and discuss their technical contributions, similarities, and strengths. We also provide a summary of more than 40 popular datasets widely used for text classification. Finally, we provide a quantitative analysis of the performance of different deep learning models on popular benchmarks, and discuss future research directions.

研究の動機と目的

  • 複数のタスクに跨るテキスト分類へ適用された深層学習モデルの全体像を要約する。
  • テキスト分類で広く用いられるデータセットを体系化し、比較する。
  • 主要なベンチマーク上で選択された深層学習モデルの定量的分析を提供し、今後の方向性を特定する。

提案手法

  • 構造化されたレビューのため、DLモデルをアーキテクチャ別 (RNN、CNN、Transformer、Capsule Net、Graph NN など) に分類する。
  • 代表的なモデルとその構成上の革新を説明する(例:DAN、fastText、Word2Vec/Doc2Vec、LSTM/Tree-LSTM、CNN変種、CapsNets、アテンション機構、メモリネットワーク、GNN、Siamese nets)。
  • テキスト分類研究で用いられるデータセット(40を超える)とベンチマークを要約する。
  • 16の標準ベンチマーク上で、DLモデルのサブセットの定量的比較を行う。
Figure 1. The architecture of the Deep Average Network (DAN) ( iyyer2015deep, ) .
Figure 1. The architecture of the Deep Average Network (DAN) ( iyyer2015deep, ) .

実験結果

リサーチクエスチョン

  • RQ1テキスト分類に用いられる支配的な深層学習アーキテクチャと、その長期的な進化は何か?
  • RQ2異なるモデルファミリ(RNN、CNN、Transformer、CapsNets、GNNなど)は、標準的なテキスト分類タスクでどのように性能を示すか?
  • RQ3DLベースのTC研究を支配するデータセットとベンチマークは何か、今後の課題は何か?
  • RQ4アテンション、メモリ拡張、グラフベースのアプローチは、性能と頑健性にどのように寄与するか?

主な発見

  • 本調査は近年のテキスト分類向けに開発された150を超える深層学習モデルを取り上げている。
  • 広く用いられる40を超えるテキスト分類データセットを要約・分析する。
  • 16の人気ベンチマーク上での定量的性能分析を提供する。
  • 本論文は、DLベースのTCにおける残された課題と今後の研究方向を議論する。
  • 手作業で作成された特徴量から埋め込み表現と大規模事前学習済みモデルへの移行を強調する。
  • モデルを実用的なファミリ(例:RNN、CNN、Transformer、Capsule Net、メモリネットワーク、GNN)に分類している。
Figure 2. The doc2vec model ( le2014distributed, ) .
Figure 2. The doc2vec model ( le2014distributed, ) .

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。