[論文レビュー] Description Based Text Classification with Reinforcement Learning
この論文はテキスト分類を QA スタイルのタスクとして再定義し、各カテゴリにクラス説明を付け、説明を強化学習で自動的に学習して、単一ラベル、マルチラベル、マルチアスペクト感情タスク全体のパフォーマンスを向上させる。
The task of text classification is usually divided into two stages: {\it text feature extraction} and {\it classification}. In this standard formalization categories are merely represented as indexes in the label vocabulary, and the model lacks for explicit instructions on what to classify. Inspired by the current trend of formalizing NLP problems as question answering tasks, we propose a new framework for text classification, in which each category label is associated with a category description. Descriptions are generated by hand-crafted templates or using abstractive/extractive models from reinforcement learning. The concatenation of the description and the text is fed to the classifier to decide whether or not the current label should be assigned to the text. The proposed strategy forces the model to attend to the most salient texts with respect to the label, which can be regarded as a hard version of attention, leading to better performances. We observe significant performance boosts over strong baselines on a wide range of text classification tasks including single-label classification, multi-label classification and multi-aspect sentiment analysis.
研究の動機と目的
- 従来のラベルのみの分類が何を分類すべきかについての明示的な指針を欠くという制限に対処する。
- 各クラスに説明を対になるようにするQAスタイルの定式化を導入する。
- 強化学習(抽出型または要約型)を介してクラス説明を自動生成する。
- 説明ベースの分類が顕在的なテキストに注意を払い、さまざまなタスクでパフォーマンスを向上させることを示す。
提案手法
- 分類を各クラスと自然言語の説明 q_y を関連付ける問題として定式化する。
- バックボーンとしてBERTを用い、セットアップに応じてNバイナリ分類器またはNクラス分類器を用いる。
- クラス説明を抽出または生成する;強化学習を介して説明生成と分類をエンドツーエンドで訓練する。
- 抽出の場合、トークン span のポリシーを用いて説明としてテキストのスパンを選択し、分類報酬を用いたREINFORCEで最適化する。
- 要約生成の場合、部分生成に報酬を割り当てるREGSを用いたSeq2Seqジェネレータを使用し、訓練を安定化させる。
- 3つの説明構築戦略: テンプレート (Tem), 抽出式 (Ext), 要約式 (Abs)。
実験結果
リサーチクエスチョン
- RQ1カテゴリに説明的ラベルを付与することで、従来のラベル埋め込みアプローチと比較してテキスト分類の性能が向上するか?
- RQ2自動生成されたクラス説明(テンプレート、抽出スパン、または要約生成を通じて)は、単一ラベル、マルチラベル、マルチアスペクト感情タスク全体で性能にどのような影響を与えるか?
- RQ3説明の品質と生成戦略がモデルの収束とデータ効率に与える影響は?
主な発見
| モデル | AGNews | 20news | DBPedia | Yahoo | YelpP | IMDB | Remarks |
|---|---|---|---|---|---|---|---|
| 説明 (Tem.) | 5.2 | 15.8 | 0.65 | 22.1 | 2.2 | 5.8 | テンプレートによる説明を用いた単一ラベルの結果;BERTを上回る |
| 説明 (Ext.) | 5.0 | 15.6 | 0.63 | 22.0 | 2.1 | 5.5 | 抽出式説明を用いた単一ラベルの結果;Temを上回る。 |
| 説明 (Abs.) | 5.1 | 15.4 | 0.62 | 21.8 | 2.0 | 5.5 | 抽象的説明を用いた単一ラベルの結果;いくつかの指標で最高。 |
- 説明ベースの手法は、テストされたタスクで一貫してBERTのベースラインを上回る。
- テンプレートによる説明はBERTを上回り、抽出式および要約式戦略でさらなる利得をもたらす。
- 抽出式および要約式戦略は、マルチラベルおよびマルチアスペクトタスクでより大きな利益を生み出し、特定のデータセット(例: BeerAdvocateとTripAdvisor)で大幅な改善を見せる。
- 長いテキストは説明ベースの指示の恩恵をより受け、ハードアテンション機構として機能する。
- RLベースの説明生成はテンプレートで初期化しても収束可能で、抽出式は要約式より収束が速い。
- 説明を使用すると、AGNews, 20news, DBPedia, Yahoo, YelpP, IMDB, Reuters, AAPD, BeerAdvocate, TripAdvisorデータセット全体でベースラインに対する誤差率を低減する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。