QUICK REVIEW

[論文レビュー] Consistent Dialogue Generation with Self-supervised Feature Learning

Yizhe Zhang, Xiang Gao|arXiv (Cornell University)|Mar 13, 2019

Topic Modeling参考文献 42被引用数 30

ひとこと要約

本稿では、ラベルなし会話データから分離可能で二値のトピックおよびパーソナ特徴を学習する自己教師付き対話生成モデルを提案する。判別的特徴抽出器と分離損失、制御可能な生成を用いることで、2つのベンチマークで、明示的なパーソナ監視を用いたモデルを上回る、最先端のトピックおよびパーソナの一貫性を達成する。

ABSTRACT

Generating responses that are consistent with the dialogue context is one of the central challenges in building engaging conversational agents. We demonstrate that neural conversation models can be geared towards generating consistent responses by maintaining certain features related to topics and personas throughout the conversation. Past work has required external supervision that exploits features such as user identities that are often unavailable. In our approach, topic and persona feature extractors are trained using a contrastive training scheme that utilizes the natural structure of dialogue data. We further adopt a feature disentangling loss which, paired with controllable response generation techniques, allows us to promote or demote certain learned topics and persona features. Evaluation results demonstrate the model's ability to capture meaningful topics and persona features. The incorporation of the learned features brings significant improvement in terms of the quality of generated responses on two dialogue datasets.

研究の動機と目的

ラベル付きまたは機微なユーザーIDデータに依存せずに、オープンドメイン対話システムにおけるトピックおよびパーソナの一貫性を維持する課題に対処すること。
会話構造から直接意味的で分離可能なトピックおよびパーソナ特徴を抽出する自己教師付き手法を開発すること。
学習した二値特徴を操作することで制御可能な応答生成を可能にし、解釈可能性と制御性を向上させること。
教師なし特徴学習が、明示的なパーソナアノテーションを用いたモデルと同等またはそれを上回る性能を達成できることを示すこと。

提案手法

自己教師付き特徴抽出器は、発話者の身元や外部ラベルを一切必要とせず、会話履歴からトピックおよびパーソナ表現を同定する。
二値特徴表現を用いることで解釈性を向上させ、生成中に特定のトピックやパーソナを明確にオン/オフ制御できるようにする。
異なるトピックおよびパーソナに対して、明確に分離され重複のない特徴を学習するよう促すため、分離損失を導入する。
応答生成器は抽出された特徴を制御信号として用い、高レベルな文脈特徴に整合した一貫性のある応答生成を可能にする。
デコード中に特定の特徴を促進または抑制する制御可能な生成技術を適用し、一貫性を強化する。
ニューラル文エンコーダーが、従来のbag-of-words特徴に代わって豊富な文脈表現を捉える。

実験結果

リサーチクエスチョン

RQ1明示的監視やラベル付きパーソナデータなしで、対話生成におけるトピックおよびパーソナの一貫性を向上させられるか？
RQ2会話構造からの自己教師付き学習が、分離可能で解釈可能なトピックおよびパーソナ特徴を効果的に抽出できるか？
RQ3二値特徴表現と分離損失を用いることで、応答生成における制御性と一貫性が向上するか？
RQ4明示的なパーソナ情報なしで学習したモデルが、明示的なパーソナ埋め込みを用いたモデルを上回れるか？

主な発見

CoCon-TPモデルは、TwitterおよびMaluubaデータセットの両方で最高の関連性スコアを達成し、BLEUスコアはそれぞれ3.31および5.8であった。
CoCon-TP-binバージョンは、すべてのベースラインを上回る多様性指標を達成し、TwitterデータセットではDist-1が10.59、Dist-2が0.100であった。
人間評価では、CoCon-TPはトピック一貫性（45.20％の好まれる割合）およびパーソナ一貫性（40.95％の好まれる割合）でベースラインを上回った。seq2seqおよびパーソナモデルと比べて顕著な向上が見られた。
人間の出力と比較した場合、人間の参照を除くすべてのベースラインよりCoCon-TPが好まれており、トピック一貫性で51.65％、パーソナ一貫性で45.30％の好まれる割合を示した。
明示的なパーソナ情報を持つモデルと比較しても、一貫性の向上が顕著に見られた。これは自己教師付き特徴学習の有効性を示している。
アブレーションスタディにより、分離損失と二値特徴表現が特徴の解釈性と制御性を顕著に向上させたことが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。