QUICK REVIEW

[論文レビュー] Policy-Driven Neural Response Generation for Knowledge-Grounded Dialogue Systems

Behnam Hedayatnia, Karthik Gopalakrishnan|arXiv (Cornell University)|May 26, 2020

Topic Modeling被引用数 10

ひとこと要約

本稿では、知識に基づく対話システムにおけるポリシー駆動型ニューラル応答生成フレームワークを提案する。このフレームワークは、知識文、対話行動、トピック情報が含まれるアクションプランを用いて応答生成をガイドする。このプランを条件として系列対系列モデルを適用することで、応答の関連性と制御性が向上し、文単位のポリシーが自動評価および人間評価の両方で、ターン単位のポリシーおよびベースラインモデルを上回る性能を発揮する。

ABSTRACT

Open-domain dialogue systems aim to generate relevant, informative and engaging responses. Seq2seq neural response generation approaches do not have explicit mechanisms to control the content or style of the generated response, and frequently result in uninformative utterances. In this paper, we propose using a dialogue policy to plan the content and style of target responses in the form of an action plan, which includes knowledge sentences related to the dialogue context, targeted dialogue acts, topic information, etc. The attributes within the action plan are obtained by automatically annotating the publicly released Topical-Chat dataset. We condition neural response generators on the action plan which is then realized as target utterances at the turn and sentence levels. We also investigate different dialogue policy models to predict an action plan given the dialogue context. Through automated and human evaluation, we measure the appropriateness of the generated responses and check if the generation models indeed learn to realize the given action plans. We demonstrate that a basic dialogue policy that operates at the sentence level generates better responses in comparison to turn level generation as well as baseline models with no action plan. Additionally the basic dialogue policy has the added effect of controllability.

研究の動機と目的

既存の系列対系列対話モデルにはコンテンツおよびスタイルの制御が不足しており、しばしば情報のない応答を生成するという問題に対処する。
知識、対話行動、トピックを含むアクションプランの形で、応答の内容とスタイルを計画する対話ポリシーを開発する。
アクションプランを条件としてニューラル応答生成器を設定し、文単位およびターン単位の両方で応答品質を向上させる。
モデルが与えられたアクションプランを効果的に実現しているかどうか、およびポリシー設計（文単位対ターン単位）が性能に与える影響を評価する。
自動評価および人間評価を通じて、応答の適切さと制御性の向上を示す。

提案手法

Topical-Chatデータセットをアノテートし、アクションプランに必要な属性（知識文、対話行動、トピック情報）を抽出する。
対話文脈からアクションプランを予測する対話ポリシーモデルを設計し、文単位とターン単位の両方のバリアントを用意する。
予測されたアクションプランを条件として系列対系列ニューラル応答生成器を設定し、文脈的に関連性があり、スタイルが一致する応答を生成する。
アクションプランを、発話および文単位の両方のレベルで応答生成をガイドする制御メカニズムとして使用する。
自動指標と人間評価を用いて、応答品質およびプラン実現度を評価するため、生成モデルを訓練および評価する。
アクションプランなしのベースラインモデルと比較して、文単位ポリシーとターン単位ポリシーの両方の性能を評価する。

実験結果

リサーチクエスチョン

RQ1知識、対話行動、トピックを含むアクションプランを通じてコンテンツとスタイルを計画する対話ポリシーは、知識に基づく対話システムにおける応答生成品質を向上させることができるか？
RQ2構造化されたアクションプランを条件として応答生成を行うことで、ベースラインseq2seqモデルと比較してより適切で情報豊富な応答が得られるか？
RQ3文単位のポリシーはターン単位のポリシーに比べ、応答生成をガイドし、応答品質を向上させるためにより効果的か？
RQ4ニューラル応答生成器は、アクションプランに指定された属性をどの程度正しく実現しているか？
RQ5アクションプランに知識、対話行動、トピック情報を組み込むことで、応答の制御性および関連性はどのように向上するか？

主な発見

文単位の対話ポリシーは、ターン単位の生成とアクションプランなしのベースラインモデルを大きく上回り、応答の適切さにおいて顕著な優位性を示した。
アクションプランの導入により、自動評価および人間評価の両方で、より情報豊かで文脈的に関連性のある応答が得られた。
生成された応答がアクションプランに指定された知識、対話行動、トピックとより一致するため、モデルの制御性が向上した。
人間評価では、アクションプランを条件とした応答が、ベースラインモデルの応答よりも自然で魅力的であると評価された。
アクションプラン機構は、文単位およびターン単位の両方のレベルで応答生成を効果的にガイドしており、特に文単位の計画が優れた結果をもたらした。
提案されたフレームワークは、アクションプランに記載された属性を効果的に実現しており、モデルがポリシーが提供する制御信号を内部化していることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。