QUICK REVIEW

[論文レビュー] DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery

Kun Li, Zhennan Wu|ArXiv.org|May 20, 2025

Statistical and Computational Modeling被引用数 3

ひとこと要約

DrugPilot は、パラメータ化メモリプールと Fe-Fo フィードバック機構を特徴とする LLM ベースのパラメータ化推論エージェントで、ツール呼び出しとタスクフォーカスを改善して多段階の薬物発見タスクを自動化します。

ABSTRACT

Large language models (LLMs) integrated with autonomous agents hold significant potential for advancing scientific discovery through automated reasoning and task execution. However, applying LLM agents to drug discovery is still constrained by challenges such as large-scale multimodal data processing, limited task automation, and poor support for domain-specific tools. To overcome these limitations, we introduce DrugPilot, a LLM-based agent system with a parameterized reasoning architecture designed for end-to-end scientific workflows in drug discovery. DrugPilot enables multi-stage research processes by integrating structured tool use with a novel parameterized memory pool. The memory pool converts heterogeneous data from both public sources and user-defined inputs into standardized representations. This design supports efficient multi-turn dialogue, reduces information loss during data exchange, and enhances complex scientific decision-making. To support training and benchmarking, we construct a drug instruction dataset covering eight core drug discovery tasks. Under the Berkeley function-calling benchmark, DrugPilot significantly outperforms state-of-the-art agents such as ReAct and LoT, achieving task completion rates of 98.0%, 93.5%, and 64.0% for simple, multi-tool, and multi-turn scenarios, respectively. These results highlight DrugPilot's potential as a versatile agent framework for computational science domains requiring automated, interactive, and data-integrated reasoning.

研究の動機と目的

LLM ベースのエージェントを使用してエンドツーエンドの薬物発見ワークフローを自動化する。
パラメータ化メモリプールを用いて多モーダル薬物データを処理し、情報を効率的に標準化・ retrieved する。
長い複数ターン対話における推論エラーおよびタスクドリフトを、フィードバックとフォーカス機構で緩和する。
薬物発見タスクのLLM評価とファインチューニングのためのドメイン特化ツール呼び出しデータセット（TCDD）を提供する。

提案手法

DrugPilot の4要素フレームワークを導入：LLM バックボーン、パラメータ化メモリプール（PMP）、ツール呼び出しつき8つの薬物発見ツール、そして Fe-Fo メカニズム。
TCDD データセット（8 タスク全体で 2,800 サンプル）を作成・活用して薬物発見ツール呼び出しのための LLM をファインチューニングする。
パラメータを構造化されたキー-バリュー形式で保存する PMP を開発し、パラメータ抽出を効率化しプロンプト長を削減する。
エラー情報を提供する Fe-Fo メカニズムを実装し、複数ターン推論中の整列を維持するためのタスク重視型プロンプトを提供する。
TCDD を用いた 7B–9B の LLM で LoRA ファインチューニングを適用し、正規表現ベースのパーサーで出力後処理を行いフォーマット信頼性を向上させる。
Berkeley 関数呼び出しフレームワークを用いて DrugPilot を基準エージェントと比較評価し、単純・多機能・多-turn タスクそれぞれのタスク完了率を報告する。

実験結果

リサーチクエスチョン

RQ1ツール呼び出しを介して、LLM ベースのエージェントは多段階薬物発見タスクを自動化できるか。
RQ2パラメータ化メモリプールは大規模な多モーダル薬物データの取り扱いを改善し、情報損失を低減できるか。
RQ3Fe-Fo メカニズムは一般的な LLM 推論エラーを減らし、長い対話中のタスクフォーカスを維持できるか。
RQ4TCDD によるドメイン特化ファインチューニングは薬物発見ツール呼び出し精度にどの程度有効か。
RQ5DrugPilot は薬物発見におけるツール呼び出しベンチマークで最先端エージェントと比べてどの程度優れているか。

主な発見

DrugPilot は単純、複数、長回転タスクでそれぞれ 98.0%、93.5%、64.0% のタスク完了率を達成した。
DrugPilot は SOTA エージェント ReAct を三つの評価カテゴリでそれぞれ 13.2%、66.1%、80.3% 向上させた。
本手法は Berkeley フレームワーク下で薬物発見ツール指示データセット（TCDD）に対して高度なツール呼び出し能力を示した。
パラメータ化メモリプール（PMP）は構造化されたスケーラブルなパラメータ処理を可能にし、多モーダルデータの文脈サイズを削減し取得を改善する。
Fe-Fo メカニズムはターゲットを絞ったフィードバックとタスク重視プロンプトを提供して、推論中のエラーを緩和しフォーカスを維持する。
著者はコードリポジトリを https://github.com/wzn99/DrugPilot で公開している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。