[論文レビュー] UniMS-RAG: A Unified Multi-source Retrieval-Augmented Generation for Personalized Dialogue Systems
UniMS-RAG は、複数ソースの知識源計画、検索、応答生成を単一の Seq2Seq フレームワークに統合し、 acting および evaluation トークンを用いてマルチソースのパーソナライズを管理し、応答を改善する自己洗練ループを持つ。
Large Language Models (LLMs) has shown exceptional capabilities in many natual language understanding and generation tasks. However, the personalization issue still remains a much-coveted property, especially when it comes to the multiple sources involved in the dialogue system. To better plan and incorporate the use of multiple sources in generating personalized response, we firstly decompose it into three sub-tasks: Knowledge Source Selection, Knowledge Retrieval, and Response Generation. We then propose a novel Unified Multi-Source Retrieval-Augmented Generation system (UniMS-RAG) Specifically, we unify these three sub-tasks with different formulations into the same sequence-to-sequence paradigm during the training, to adaptively retrieve evidences and evaluate the relevance on-demand using special tokens, called acting tokens and evaluation tokens. Enabling language models to generate acting tokens facilitates interaction with various knowledge sources, allowing them to adapt their behavior to diverse task requirements. Meanwhile, evaluation tokens gauge the relevance score between the dialogue context and the retrieved evidence. In addition, we carefully design a self-refinement mechanism to iteratively refine the generated response considering 1) the consistency scores between the generated response and retrieved evidence; and 2) the relevance scores. Experiments on two personalized datasets (DuLeMon and KBP) show that UniMS-RAG achieves state-of-the-art performance on the knowledge source selection and response generation task with itself as a retriever in a unified manner. Extensive analyses and discussions are provided for shedding some new perspectives for personalized dialogue systems.
研究の動機と目的
- パーソナライズされた知識に基づく対話を3つのサブタスクに分解する: 知識ソース選択、知識検索、応答生成。
- これらのサブタスクを1つのシーケンス対シーケンスモデルに統合して、プランナー、リトリーバ、リーダーの役割を可能にする。
- 特別な acting トークンと evaluation トークンを介して、オンデマンドの関連度評価と複数の知識源との適応的相互作用を可能にする。
- 証拠の一貫性と文脈の関連性を考慮して生成された応答を反復的に改善する自己洗練機構を導入する。
提案手法
- acting トークンと evaluation トークンを用いて、統一された Seq2Seq モデル内で知識ソース選択、検索、生成をトークン予測タスクとして定式化する。
- ソース決定と証拠関連性を示す特殊トークンを導入し、モデルがソースの使用を計画し、依存関係を考慮した順序で検索できるようにする。
- 3つの目的関数で訓練する: 計画ロス、関連性予測ロス、応答生成ロス。
- 関連性信号の二重経路を使用する。リトリーバー(DPR)を微調整するか、LLMをプロンプトして類似度スコアを提供させ、次に UniMS-RAG を訓練してこれらの信号を予測する。
- 推論時には、更新された証拠と一貫性・関連性のスコアを組み合わせたスコアに基づいて応答を再生成する自己洗練ループを適用する。
実験結果
リサーチクエスチョン
- RQ1大規模言語モデルは、外部ソースを使用すべきか、どのソースを呼び出すべきかを決定するプランナーとして機能できるか?
- RQ2大規模言語モデルは、複数のソースから高い関連性を持つ証拠を取得するリトリーバーとして機能できるか?
- RQ3大規模言語モデルは、取得した証拠を最終応答に組み込むリーダーとして機能できるか?
- RQ4統一された UniMS-RAG フレームワークは、パーソナライズ対話における知識ソース選択と応答生成を改善するか?
主な発見
- UniMS-RAG は、パーソナライズされた対話ベンチマークで自身をリトリーバーとして使用した場合、知識ソース選択と応答生成で最先端の性能を達成する。
- このフレームワークは、独立した知識源と相互依存する知識源の両方をサポートし、さまざまなソース間の関係に適応できる。
- 推論時の自己洗練は、証拠の一貫性と文脈の関連性を再評価することで応答の根拠付けを改善する。
- このアプローチは、2つのパーソナライズデータセット DuLeMon と KBP に対して堅牢性を示し、広範な分析と人間評価を伴う。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。