Skip to main content
QUICK REVIEW

[論文レビュー] Conversational Health Agents: A Personalized LLM-Powered Agent Framework

Mahyar Abbasian, Iman Azimi|arXiv (Cornell University)|Oct 3, 2023
Topic Modeling被引用数 28
ひとこと要約

この論文は openCHA を提示します。オープンソースの LLM-poweRed フレームワークで、外部データソースと分析ツールを組み合わせることにより、個別化された、マルチモーダルで最新の対話型ヘルスエージェントを実現します。これは three つのヘルスケアデモンストレーションで実証されています。

ABSTRACT

Conversational Health Agents (CHAs) are interactive systems that provide healthcare services, such as assistance and diagnosis. Current CHAs, especially those utilizing Large Language Models (LLMs), primarily focus on conversation aspects. However, they offer limited agent capabilities, specifically lacking multi-step problem-solving, personalized conversations, and multimodal data analysis. Our aim is to overcome these limitations. We propose openCHA, an open-source LLM-powered framework, to empower conversational agents to generate a personalized response for users' healthcare queries. This framework enables developers to integrate external sources including data sources, knowledge bases, and analysis models, into their LLM-based solutions. openCHA includes an orchestrator to plan and execute actions for gathering information from external sources, essential for formulating responses to user inquiries. It facilitates knowledge acquisition, problem-solving capabilities, multilingual and multimodal conversations, and fosters interaction with various AI platforms. We illustrate the framework's proficiency in handling complex healthcare tasks via two demonstrations and four use cases. Moreover, we release openCHA as open source available to the community via GitHub.

研究の動機と目的

  • 医療における個別化と多段階の問題解決を可能にし、チャットを超える CHA の必要性を動機づける。
  • 現在の LLM ベースの CHA のデータアクセス、最新性、多モーダル機能の制約に対処する。
  • 健康クエリのためにデータソース、ナレッジベース、分析モデルを統合するオープンなフレームワークを提案する。
  • 多言語・マルチモーダルな対話と外部 AI ツール統合をサポートする設計を提供する。

提案手法

  • ユーザーの問 queries に答えるために計画・情報収集・実行を行う LLM-poweRed オーケストレータを導入する。
  • Tree of Thought や ReAct などの prompting 手法を用いたタスクリプタプニングでクエリを分解し、タスク列を生成する。
  • 外部タスクを翻訳・実行し、結果をプランニングにフィードバックする双方向タスク実行者を実装する。
  • マルチモーダル分析のメタデータと中間結果を保存する Data Pipe を組み込む。
  • データをプランニングと応答生成の効果的なプロンプトへ変換する Promptist を活用する。
  • Healthcare Data Sources、Knowledge Bases、AI/Analysis Models、Translators などのExternal Sources を接続して多言語対応を実現する。

実験結果

リサーチクエスチョン

  • RQ1外部データソースを統合することで、LLM-poweRed オーケストレータが個別化された多段階の医療問題解決をどのように可能にするか?
  • RQ2openCHA はマルチモーダルかつ多言語の医療会話をサポートしつつ、信頼性と最新性を維持できるか?
  • RQ3外部データソースと分析ツールの使用が CHA の応答の質と信頼性にどのような影響を与えるか?
  • RQ4一般的な健康 Q&A、患者の健康記録、ストレス推定というデモンストレーションは openCHA の能力をどのように示すか?

主な発見

  • openCHA は外部データソースとマルチモーダルなヘルス分析を活用することで個別化された応答を可能にする。
  • デモアプリケーションは Tree of Thought prompting や ReAct のような代替手法を用いたタスクの計画とシーケンス化を示している。
  • デモ3のストレス推定パイプラインは PPG データを使用してテストセットで 86% の精度を達成した。
  • フレームワークは多言語対応と翻訳をサポートし、多様なユーザーへのアクセス性を向上させる。
  • GitHub 上のオープンソース提供により、コミュニティの採用と拡張が促進される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。