Skip to main content
QUICK REVIEW

[論文レビュー] Global-Locally Self-Attentive Dialogue State Tracker

Victor W. Zhong, Caiming Xiong|arXiv (Cornell University)|May 19, 2018
Speech and dialogue systems参考文献 35被引用数 70
ひとこと要約

GLADは、スロット間でパラメータを共有しつつスロット固有の特徴を学習するDSTのグローバル-ローカル自己注意エンコーダを導入し、WoZとDSTC2で最先端の結果を達成します。グローバル-ローカルのパラメータ共有と自己注意を通じて、希少なスロット値の組み合わせの追跡を改善します。

ABSTRACT

Dialogue state tracking, which estimates user goals and requests given the dialogue context, is an essential part of task-oriented dialogue systems. In this paper, we propose the Global-Locally Self-Attentive Dialogue State Tracker (GLAD), which learns representations of the user utterance and previous system actions with global-local modules. Our model uses global modules to share parameters between estimators for different types (called slots) of dialogue states, and uses local modules to learn slot-specific features. We show that this significantly improves tracking of rare states and achieves state-of-the-art performance on the WoZ and DSTC2 state tracking tasks. GLAD obtains 88.1% joint goal accuracy and 97.1% request accuracy on WoZ, outperforming prior work by 3.7% and 5.5%. On DSTC2, our model obtains 74.5% joint goal accuracy and 97.5% request accuracy, outperforming prior work by 1.1% and 1.0%.

研究の動機と目的

  • DSTデータセットにおける希少なスロット-値ペアに対処することにより、対話状態推定の改善を動機づける。
  • スロット間でパラメータを共有しつつスロット固有の特徴を学習する、グローバル-ローカル自己注意エンコーダを提案する。
  • 手作り辞書なしのエンドツーエンド学習を通じて WoZ および DSTC2 で最先端の性能を示す。

提案手法

  • 全スロットに跨る一般的特徴を捉えるためのグローバル双方向LSTMを用いる(グローバルモジュール)。
  • 特定のスロットに条件づけられた局所双方向LSTMを用いる(ローカルモジュール)。
  • グローバルと局所のエンコードをスロット固有の重みにより組み合わせて、最終的なエンコーダ表現(beta^s)を形成する。
  • グローバルおよびローカルの自己注意を適用して文脈ベクトル(c^g, c^s)を計算し、グローバル-ローカルのアテンション文脈(c)を形成する。
  • GLADエンコーダでユーザー発話、以前のシステムアクション、スロット-値ペアをエンコードし、発話由来とアクション由来の2つのスコアラーと学習済みの重み付けを用いて最終スコアを生成する。
Figure 1: An example dialogue from the WoZ restaurant reservation corpus. Dashed lines divide turns in the dialogue. A turn contains an user utterance (purple), followed by corresponding turn-level goals and requests (blue). The system then executes actions (yellow), and formulates the result into a
Figure 1: An example dialogue from the WoZ restaurant reservation corpus. Dashed lines divide turns in the dialogue. A turn contains an user utterance (purple), followed by corresponding turn-level goals and requests (blue). The system then executes actions (yellow), and formulates the result into a

実験結果

リサーチクエスチョン

  • RQ1スロット間でパラメータを共有しつつスロット固有の表現を維持することは、希少なスロット-値ペアに特に有効でDSTを改善するのか?
  • RQ2グローバルおよびローカルの自己注意成分は、ターンレベルおよびジョイントゴール追跡の正確性に相補的な利点をもたらすのか?
  • RQ3ノイズのあるASR条件(DSTC2)とクリーンな発話(WoZ)の下で、GLADはDSTC2およびWoZデータセットにおいて従来の最先端とどう比較するのか?

主な発見

データセットターンゴールジョイントゴールターンリクエスト
DSTC274.5 ±0.2%88.1 ±0.4%97.5 ±0.1%
WoZ88.1 ±0.4%-97.1 ±0.2%
  • GLADは最先端の結果を達成: WoZで結合ゴール正確度88.1%、リクエスト正確度97.1%。
  • DSTC2で結合ゴール正確度74.5%、リクエスト正確度97.5%を達成。
  • アブレーション研究は、グローバル-ローカルの共有と自己注意が希少なスロット-値ペアの頑健性向上に寄与し、グローバル共有またはスロット固有成分のいずれかを撤去した変種よりも優れていることを示す。
  • WoZでは、結合ゴール正確度で前の最高を3.7%、ターンレベルのリクエスト正確度で5.5%上回る。
  • DSTC2では、結合ゴール正確度で前の最高を1.1%、ターンレベルのリクエスト正確度で1.0%上回る。
Figure 2: The Global-Locally Self-Attentive Dialogue State Tracker.
Figure 2: The Global-Locally Self-Attentive Dialogue State Tracker.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。