QUICK REVIEW

[論文レビュー] SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine Teaching

Baolin Peng, Chunyuan Li|arXiv (Cornell University)|May 11, 2020

Topic Modeling参考文献 56被引用数 99

ひとこと要約

SOLOISTは、多様な対話データで事前学習した単一のTransformerモデルを用いてタスク指向の対話ボットを構築し、機械教示を通じてファインチューニングすることで、few-shot シナリオにおいて最先端の性能とラベリングコストの削減を実現します。

ABSTRACT

We present a new method SOLOIST that uses transfer learning and machine teaching to build task bots at scale. We parameterize classical modular task-oriented dialog systems using a Transformer-based auto-regressive language model, which subsumes different dialog modules into a single neural model. We pre-train, on heterogeneous dialog corpora, a task-grounded response generation model, which can generate dialog responses grounded in user goals and real-world knowledge for task completion. The pre-trained model can be efficiently adapted to accomplish new tasks with a handful of task-specific dialogs via machine teaching, where training samples are generated by human teachers interacting with the system. Experiments show that (i) SOLOIST creates new state-of-the-art on well-studied task-oriented dialog benchmarks, including CamRest676 and MultiWOZ; (ii) in the few-shot fine-tuning settings, SOLOIST significantly outperforms existing methods, and (iii) the use of machine teaching substantially reduces the labeling cost of fine-tuning. The pre-trained models and codes are available at https://aka.ms/soloist.

研究の動機と目的

単一の事前学習済みモデルを用いることで、多数のタスクボットの構築ワークフローを簡素化する。
NLU、DST、POL、およびNLGを1つのTransformerベースのアーキテクチャに統合する。
異種の対話コーパス上でのタスク基盤型事前学習を活用する。
機械教示を介して、最小限のタスク固有データで新しいタスクへファインチューニングする。
few-shot設定で最先端の性能とラベリングコストの削減を実証する。

提案手法

モジュール化されたタスク指向対話をTransformerベースの自己回帰モデルとしてパラメータ化する。
異種の対話データ上でタスク基盤の応答生成モデルを事前学習し、信念追跡と根拠付けされた応答を学習する。
訓練目的を信念予測と根拠付けられた応答生成に分解し、対比的目的を用いる。
L_thetaを用いた多タスク事前学習目的を実装し、L_B、L_R、およびL_Cを組み合わせる。
新しいタスクに対して少数の対話でファインチューニングを行い、訂正訓練サンプルを生成するために機械教示を適用する。
デコードにヌクレアスサンプリングを用い、少数ショット学習を強化するためにより大きなモデルバリアントを採用する。

実験結果

リサーチクエスチョン

RQ1SOLOISTは標準的なタスク指向対話のベンチマークにおいて、最先端手法と比べてどのような性能を示すか？
RQ2SOLOISTはfew-shotファインチューニング設定で新しいドメインへ効果的に一般化できるか？
RQ3タスクボットのファインチューニングとラベリングコストの削減における機械教示の有効性はどの程度か？
RQ4few-shot転移性能に対するモデルサイズの影響は何か？
RQ5エンドツーエンドのグラウンディングと状態追跡を実現する上で、タスク基盤型事前学習の役割は何か？

主な発見

SOLOISTはCamRest676とMultiWOZのベンチマークで最先端の成果を達成する。
few-shotファインチューニング設定で、SOLOISTは既存手法を大きく上回る。
機械教示はファインチューニング時のラベリングコストを大幅に削減する。
より大きなモデル（SOLOIST-L）は、few-shotシナリオで一貫してベースモデルを上回る。
SOLOISTは意図分類、スロット充填、対話状態追跡などの構成タスクでも高い性能を維持する。
ベースラインと比較して、SOLOISTはエンドツーエンドの性能を維持しつつ、ドメイン特有の注釈が少なくて済む。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。