[论文解读] NeuroSymb-MRG: Differentiable Abductive Reasoning with Active Uncertainty Minimization for Radiology Report Generation
NeuroSymb-MRG 将可微分的神经符号组合理性推理与检索增强生成以及主动不确定性最小化相结合,生成结构化、临床 grounding 的放射科报告,提升事实性和标准评价指标。
Automatic generation of radiology reports seeks to reduce clinician workload while improving documentation consistency. Existing methods that adopt encoder-decoder or retrieval-augmented pipelines achieve progress in fluency but remain vulnerable to visual-linguistic biases, factual inconsistency, and lack of explicit multi-hop clinical reasoning. We present NeuroSymb-MRG, a unified framework that integrates NeuroSymbolic abductive reasoning with active uncertainty minimization to produce structured, clinically grounded reports. The system maps image features to probabilistic clinical concepts, composes differentiable logic-based reasoning chains, decodes those chains into templated clauses, and refines the textual output via retrieval and constrained language-model editing. An active sampling loop driven by rule-level uncertainty and diversity guides clinician-in-the-loop adjudication and promptbook refinement. Experiments on standard benchmarks demonstrate consistent improvements in factual consistency and standard language metrics compared to representative baselines.
研究动机与目标
- 推动自动放射科报告生成,使其 fluent 但在事实性上可靠且临床可解释。
- 开发一个统一框架,将图像映射到概率临床概念,构建可微分的推理链,并生成模板化文本输出。
- 结合检索证据和受约束的语言模型改写来润色草稿。
- 引入主动不确定性最小化,以便优先让临床医生审核高价值、高不确定性案例。
- 在代表性基线的标准放射科报告基准上展示改进。
提出的方法
- 通过基于 transformer 的概念预测器将图像特征映射到概率临床概念。
- 在概念上构建可微分的软逻辑推理链,使用具备 AND/OR/NOT 运算符的可微分逻辑层。
- 将激活的软规则解码为规范子句模板,使用规则引导的解码器。
- 在解码子句上增加检索证据与受约束的 LLM 复述,形成结构化草稿。
- 使用多主体编排系统(知识、验证、推理)结合检索增强的模板填充管线。
- 通过基于蒙特卡洛 dropout 的熵与 k-center 多样性采样引导临床医生协同 refinement,实施主动不确定性最小化。

实验结果
研究问题
- RQ1可微分神经符号推理模块是否比纯神经基线产生更一致事实性的放射科报告?
- RQ2在规则层面的主动不确定性最小化是否提升事实可靠性并减少临床风险的幻觉?
- RQ3当与基于规则的解码器相结合时,检索增强与受约束的 LLM 改写对报告质量有何影响?
- RQ4具知识图谱(如 UMLS)的一种多主体编排是否能提升报告的真实度与矛盾处理能力?
主要发现
| Method | B-1 IU X-ray | B-2 IU X-ray | B-3 IU X-ray | B-4 IU X-ray | R-L IU X-ray | MTR IU X-ray | B-1 MIMIC-CXR | B-2 MIMIC-CXR | B-3 MIMIC-CXR | B-4 MIMIC-CXR | R-L MIMIC-CXR | MTR MIMIC-CXR |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Show-Tell [27] | 0.243 | 0.130 | 0.108 | 0.078 | 0.307 | 0.157 | 0.308 | 0.190 | 0.125 | 0.088 | 0.256 | 0.122 |
| Transformer [26] | 0.372 | 0.251 | 0.147 | 0.136 | 0.317 | 0.168 | 0.316 | 0.199 | 0.140 | 0.092 | 0.267 | 0.129 |
| Att2in [24] | 0.248 | 0.134 | 0.116 | 0.091 | 0.309 | 0.162 | 0.314 | 0.198 | 0.133 | 0.095 | 0.264 | 0.122 |
| AdaAtt [20] | 0.284 | 0.207 | 0.150 | 0.126 | 0.311 | 0.165 | 0.314 | 0.198 | 0.132 | 0.094 | 0.267 | 0.128 |
| Up-Down [2] | – | – | – | – | – | – | 0.317 | 0.195 | 0.130 | 0.092 | 0.267 | 0.128 |
| M2Transformer [6] | 0.402 | 0.284 | 0.168 | 0.143 | 0.328 | 0.170 | 0.332 | 0.210 | 0.142 | 0.101 | 0.264 | 0.134 |
| R2Gen [5] | 0.470 | 0.304 | 0.219 | 0.165 | 0.371 | 0.187 | 0.353 | 0.218 | 0.145 | 0.103 | 0.277 | 0.142 |
| Contra.Attn. [19] | 0.492 | 0.314 | 0.222 | 0.169 | 0.381 | 0.193 | 0.350 | 0.219 | 0.152 | 0.109 | 0.283 | 0.151 |
| CMCL [17] | 0.473 | 0.305 | 0.217 | 0.162 | 0.378 | 0.186 | 0.344 | 0.217 | 0.140 | 0.097 | 0.281 | 0.133 |
| CMN [4] | 0.475 | 0.309 | 0.222 | 0.170 | 0.375 | 0.191 | 0.353 | 0.218 | 0.148 | 0.106 | 0.278 | 0.142 |
| Aligntransformer [32] | 0.484 | 0.313 | 0.225 | 0.173 | 0.379 | 0.204 | 0.378 | 0.235 | 0.156 | 0.112 | 0.283 | 0.158 |
| M2Tr.Prog. [21] | 0.486 | 0.317 | 0.232 | 0.173 | 0.390 | 0.192 | 0.378 | 0.232 | 0.154 | 0.107 | 0.272 | 0.145 |
| CMM+RL [22] | 0.481 | 0.316 | 0.228 | 0.181 | 0.384 | 0.201 | 0.381 | 0.232 | 0.155 | 0.109 | 0.287 | 0.151 |
| XPRONET* [28] | 0.491 | 0.325 | 0.228 | 0.169 | 0.387 | 0.202 | 0.344 | 0.215 | 0.146 | 0.105 | 0.279 | 0.138 |
| MCGN [30] | 0.481 | 0.316 | 0.226 | 0.171 | 0.372 | 0.190 | 0.373 | 0.235 | 0.162 | 0.120 | 0.282 | 0.143 |
| PPKED [18] | 0.483 | 0.315 | 0.224 | 0.168 | 0.376 | – | 0.360 | 0.224 | 0.149 | 0.106 | 0.284 | 0.149 |
| RAMT [33] | 0.482 | 0.310 | 0.221 | 0.165 | 0.377 | 0.195 | 0.362 | 0.229 | 0.157 | 0.113 | 0.284 | 0.153 |
| R2GenGPT [29] | 0.482 | 0.306 | 0.215 | 0.158 | 0.370 | 0.200 | 0.387 | 0.248 | 0.170 | 0.123 | 0.280 | 0.149 |
| VLCI ${\dagger}$ [3] | 0.324 | 0.211 | 0.151 | 0.115 | 0.379 | 0.166 | 0.357 | 0.216 | 0.144 | 0.103 | 0.256 | 0.136 |
| PromptMRG [11] | 0.401 | – | – | – | 0.281 | 0.160 | 0.398 | – | – | 0.112 | 0.268 | 0.157 |
| MedRAT [9] | 0.455 | – | – | – | 0.349 | – | 0.365 | – | – | 0.086 | 0.251 | – |
| MRG-LLM [14] | 0.529 | 0.359 | 0.266 | 0.202 | 0.408 | 0.221 | 0.416 | 0.267 | 0.182 | 0.129 | 0.296 | 0.163 |
| NeuroSymb-MRG (Ours) | 0.602 | 0.425 | 0.321 | 0.253 | 0.463 | 0.275 | 0.487 | 0.332 | 0.234 | 0.175 | 0.362 | 0.225 |
- NeuroSymb-MRG 在 IU X-ray 与 MIMIC-CXR 上的自动化指标高于强基线(BLEU、ROUGE-L、METEOR)。
- 基于规则的可微推理结合规则解码器在词汇与语义质量上优于仅 MLP 或不含符号推理的基线。
- 检索增强与 LLM 约束步骤带来收益,并通过验证器帮助减轻矛盾。
- 通过熵基采样与多样性(k-center)实现的主动不确定性最小化在保持质量的同时降低标注需求。
- 具知识代理与 UMLS 验证的多主体设置提升事实性合理性并降低矛盾陈述。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。