[論文レビュー] NeuroSymb-MRG: Differentiable Abductive Reasoning with Active Uncertainty Minimization for Radiology Report Generation
NeuroSymb-MRGは微分可能な神経-symbolic 吊下推論を retrieval-augmented generation と能動的不確実性最小化と統合し、臨床的根拠に基づく要約を構造化して、事実性と標準指標を向上させた放射線診断レポートを生成します。
Automatic generation of radiology reports seeks to reduce clinician workload while improving documentation consistency. Existing methods that adopt encoder-decoder or retrieval-augmented pipelines achieve progress in fluency but remain vulnerable to visual-linguistic biases, factual inconsistency, and lack of explicit multi-hop clinical reasoning. We present NeuroSymb-MRG, a unified framework that integrates NeuroSymbolic abductive reasoning with active uncertainty minimization to produce structured, clinically grounded reports. The system maps image features to probabilistic clinical concepts, composes differentiable logic-based reasoning chains, decodes those chains into templated clauses, and refines the textual output via retrieval and constrained language-model editing. An active sampling loop driven by rule-level uncertainty and diversity guides clinician-in-the-loop adjudication and promptbook refinement. Experiments on standard benchmarks demonstrate consistent improvements in factual consistency and standard language metrics compared to representative baselines.
研究の動機と目的
- 自動的な放射線レポート生成を、流暢でありつつ事実的に信頼性があり臨床的に解釈可能なものへ動機付ける。
- 画像を確率的臨床概念に写像し、微分可能な推論チェーンを構築し、テンプレート化されたテキスト出力を生成する統一フレームワークを開発する。
- Retrieval evidence を取り入れ、制約付き言語モデル編集を用いてドラフトを洗練させる。
- 高価値・高不確実性ケースに対して臨床医のレビューを優先させるため、能動的不確実性最小化を導入する。
- 代表的なベースラインに対して標準的な放射線レポートベンチマークで改善を示す。
提案手法
- Transformer ベースの概念予測器を介して画像特徴を確率的臨床概念に写像する。
- AND/OR/NOT演算子を備えた微分可能な論理層を用いて概念上の微分可能なソフト論理推論チェーンを構築する。
- 活性化したソフト規則を標準的な節テンプレートへと規則ガイド付きデコーダでデコードする。
- デコードされた節に取得証拠と制約付きLLMの言い換えを加えて構造化ドラフトを形成する。
- Knowledge, Verifier, Reasoning からなるマルチエージェントオーケストレーションシステムと、 retrieval-augmented テンプレート埋め込みパイプラインを適用する。
- Monte Carlo ドロップアウトベースのエントロピーと k-center 多様抽出による能動的不確実性最小化を用いて、臨床医の介入を導く。

実験結果
リサーチクエスチョン
- RQ1微分可能な神経-symbolic 推論モジュールは、純粋なニューラルベースラインと比較してレポートの事実性を高められるか。
- RQ2規則レベルでの能動的不確実性最小化は、事実性の信頼性を高め、臨床的リスクのある妄想を減らせるか。
- RQ3取得 augmentation と制約付きLLM の refinement を、規則ベースのデコーダと組み合わせた場合、報告品質にどのような影響があるか。
- RQ4ナレッジグラフ(例:UMLS)を用いたマルチエージェントオーケストレーションは、レポートの忠実度と矛盾処理にどのような影響を与えるか。
主な発見
| Method | B-1 IU X-ray | B-2 IU X-ray | B-3 IU X-ray | B-4 IU X-ray | R-L IU X-ray | MTR IU X-ray | B-1 MIMIC-CXR | B-2 MIMIC-CXR | B-3 MIMIC-CXR | B-4 MIMIC-CXR | R-L MIMIC-CXR | MTR MIMIC-CXR |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Show-Tell [27] | 0.243 | 0.130 | 0.108 | 0.078 | 0.307 | 0.157 | 0.308 | 0.190 | 0.125 | 0.088 | 0.256 | 0.122 |
| Transformer [26] | 0.372 | 0.251 | 0.147 | 0.136 | 0.317 | 0.168 | 0.316 | 0.199 | 0.140 | 0.092 | 0.267 | 0.129 |
| Att2in [24] | 0.248 | 0.134 | 0.116 | 0.091 | 0.309 | 0.162 | 0.314 | 0.198 | 0.133 | 0.095 | 0.264 | 0.122 |
| AdaAtt [20] | 0.284 | 0.207 | 0.150 | 0.126 | 0.311 | 0.165 | 0.314 | 0.198 | 0.132 | 0.094 | 0.267 | 0.128 |
| Up-Down [2] | – | – | – | – | – | – | 0.317 | 0.195 | 0.130 | 0.092 | 0.267 | 0.128 |
| M2Transformer [6] | 0.402 | 0.284 | 0.168 | 0.143 | 0.328 | 0.170 | 0.332 | 0.210 | 0.142 | 0.101 | 0.264 | 0.134 |
| R2Gen [5] | 0.470 | 0.304 | 0.219 | 0.165 | 0.371 | 0.187 | 0.353 | 0.218 | 0.145 | 0.103 | 0.277 | 0.142 |
| Contra.Attn. [19] | 0.492 | 0.314 | 0.222 | 0.169 | 0.381 | 0.193 | 0.350 | 0.219 | 0.152 | 0.109 | 0.283 | 0.151 |
| CMCL [17] | 0.473 | 0.305 | 0.217 | 0.162 | 0.378 | 0.186 | 0.344 | 0.217 | 0.140 | 0.097 | 0.281 | 0.133 |
| CMN [4] | 0.475 | 0.309 | 0.222 | 0.170 | 0.375 | 0.191 | 0.353 | 0.218 | 0.148 | 0.106 | 0.278 | 0.142 |
| Aligntransformer [32] | 0.484 | 0.313 | 0.225 | 0.173 | 0.379 | 0.204 | 0.378 | 0.235 | 0.156 | 0.112 | 0.283 | 0.158 |
| M2Tr.Prog. [21] | 0.486 | 0.317 | 0.232 | 0.173 | 0.390 | 0.192 | 0.378 | 0.232 | 0.154 | 0.107 | 0.272 | 0.145 |
| CMM+RL [22] | 0.481 | 0.316 | 0.228 | 0.181 | 0.384 | 0.201 | 0.381 | 0.232 | 0.155 | 0.109 | 0.287 | 0.151 |
| XPRONET* [28] | 0.491 | 0.325 | 0.228 | 0.169 | 0.387 | 0.202 | 0.344 | 0.215 | 0.146 | 0.105 | 0.279 | 0.138 |
| MCGN [30] | 0.481 | 0.316 | 0.226 | 0.171 | 0.372 | 0.190 | 0.373 | 0.235 | 0.162 | 0.120 | 0.282 | 0.143 |
| PPKED [18] | 0.483 | 0.315 | 0.224 | 0.168 | 0.376 | – | 0.360 | 0.224 | 0.149 | 0.106 | 0.284 | 0.149 |
| RAMT [33] | 0.482 | 0.310 | 0.221 | 0.165 | 0.377 | 0.195 | 0.362 | 0.229 | 0.157 | 0.113 | 0.284 | 0.153 |
| R2GenGPT [29] | 0.482 | 0.306 | 0.215 | 0.158 | 0.370 | 0.200 | 0.387 | 0.248 | 0.170 | 0.123 | 0.280 | 0.149 |
| VLCI ${\dagger}$ [3] | 0.324 | 0.211 | 0.151 | 0.115 | 0.379 | 0.166 | 0.357 | 0.216 | 0.144 | 0.103 | 0.256 | 0.136 |
| PromptMRG [11] | 0.401 | – | – | – | 0.281 | 0.160 | 0.398 | – | – | 0.112 | 0.268 | 0.157 |
| MedRAT [9] | 0.455 | – | – | – | 0.349 | – | 0.365 | – | – | 0.086 | 0.251 | – |
| MRG-LLM [14] | 0.529 | 0.359 | 0.266 | 0.202 | 0.408 | 0.221 | 0.416 | 0.267 | 0.182 | 0.129 | 0.296 | 0.163 |
| NeuroSymb-MRG (Ours) | 0.602 | 0.425 | 0.321 | 0.253 | 0.463 | 0.275 | 0.487 | 0.332 | 0.234 | 0.175 | 0.362 | 0.225 |
- NeuroSymb-MRG は IU X-ray と MIMIC-CXR における自動指標で強力なベースラインより高い成績を達成(BLEU、ROUGE-L、METEOR)。
- 規則レベルの微分可能推論と規則デコーダの組み合わせは、MLPのみまたは非シンボリックなベースラインより語彙的・意味的品質を向上させる。
- 取得 augmentation と LLM 制約ステップは利益をもたらし、 verifier による矛盾の軽減を支援する。
- エントロピーベースのサンプリングと多様性(k-center)を用いた能動的不確実性最小化は、品質を維持しつつ注釈の必要性を削減する。
- 知識エージェントと UMLS 検証を備えたマルチエージェント構成は、事実性の合理性を高め、矛盾する主張を減らす。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。