[論文レビュー] SAGE: Agentic Framework for Interpretable and Clinically Translatable Computational Pathology Biomarker Discovery
SAGEは、画像由来の病理バイオマーカーを生物学的根拠へと結びつける構造化された主体的フレームワークで、臨床翻訳のための解釈可能な仮説とエンド・ツー・エンドの経験的検証を実現します。文献に基づく推論、多 modal データ分析、検証優先のパイプラインを統合し、生物学的に意味のあるバイオマーカーを発見します。
Despite significant progress in computational pathology, many AI models remain black-box and difficult to interpret, posing a major barrier to clinical adoption due to limited transparency and explainability. This has motivated continued interest in engineered image-based biomarkers, which offer greater interpretability but are often proposed based on anecdotal evidence or fragmented prior literature rather than systematic biological validation. We introduce SAGE (Structured Agentic system for hypothesis Generation and Evaluation), an agentic AI system designed to identify interpretable, engineered pathology biomarkers by grounding them in biological evidence. SAGE integrates literature-anchored reasoning with multimodal data analysis to correlate image-derived features with molecular biomarkers, such as gene expression, and clinically relevant outcomes. By coordinating specialized agents for biological contextualization and empirical hypothesis validation, SAGE prioritizes transparent, biologically supported biomarkers and advances the clinical translation of computational pathology.
研究の動機と目的
- image由来のバイオマーカーの解釈性を向上させるために生物学的根拠に仮説をグラウンドする。
- 文献に基づく推論を多モーダルデータと統合して、画像特徴を分子・臨床エンドポイントへ結びつける。
- 臨床検証の実現可能性を重視した仮説生成・改良・検証を専門エージェントの連携で行う。
提案手法
- 文献から構造化推論のためのドメイン特化型生物医薬知識グラフを構築する。
- Ontologistを用いて経路を公理へグラウンドし、Scientistが臨床的に検証可能な仮説を生成する。
- four-score multi-criteria ロジック(Logic・Relevance・Novelty・Surprise)で仮説を評価し、Prover・Verifier・Judgeによる novelty deb ate を行う。
- 臨床的実現可能性を評価する専用Feasibility Agentがデータ入手性・ツール整備・論理・タイムラインを評価する。
- Coding Agentがツールベースのコード生成・実行をサンドボックスで行い、Summary Agentが結果を統合して仮説を実行可能な検証分析へ翻訳する。
実験結果
リサーチクエスチョン
- RQ1病理由来の画像特徴を分子マーカーおよび臨床アウトカムへどのように生物学的にグラウンドできるか?
- RQ2専門エージェントの連携の lineage が、解釈可能な仮説生成と実証可能な経験的検証を可能にするか?
- RQ3多重批評者による novelty ディベートは、革新性評価の較正と新規性の分離性を改善するか?
- RQ4膀胱癌におけるエンドツーエンドの生検証パイプラインがエンドツーエンドのバイオマーカー発見に与える影響は?
- RQ5プロンプト設計・メモリ・パイプライン構成などの設計選択は仮説の質と計算効率にどう影響するか?
主な発見
- 膀胱癌における共同FABP5とTLS様リンパ組織集合塊の予後バイオマーカーを、解釈可能な生物学と検証済み生存分析とともにエンドツーエンドで発見した。
- SAGEの知識グラフグラウンディング、複数経路の公理的推論、検証優先ループにより、臨床検証が可能な生物学的に意味のある仮説を生み出せる。
- 複数の批評者による検討は新規性の較正を改善し、新規性の分離性を高め、偽陽性を減らす。
- グラフベースのパイプラインは、プロンプトと完結トークン数・計算コストを削減しつつ、ベースラインと比較して新規性を維持する。
- ディベレーションは新規性評価の正確さを有意に高め、特に極端に新規な提案や不適切な提案に対して費用対効果の高い改善をもたらす。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。