Skip to main content
QUICK REVIEW

[논문 리뷰] NeuroSymb-MRG: Differentiable Abductive Reasoning with Active Uncertainty Minimization for Radiology Report Generation

Rong Fu, Yiqing Lyu|arXiv (Cornell University)|2026. 03. 02.
Topic Modeling인용 수 0
한 줄 요약

NeuroSymb-MRG는 미분 가능 신경-상징적 귀납 추론을 검색 기반 생성 및 능동적 불확실성 최소화와 결합하여 구조화되고 임상적으로 근거 있는 방사선 보고서를 생성하고 사실성 및 표준 지표를 향상시킵니다.

ABSTRACT

Automatic generation of radiology reports seeks to reduce clinician workload while improving documentation consistency. Existing methods that adopt encoder-decoder or retrieval-augmented pipelines achieve progress in fluency but remain vulnerable to visual-linguistic biases, factual inconsistency, and lack of explicit multi-hop clinical reasoning. We present NeuroSymb-MRG, a unified framework that integrates NeuroSymbolic abductive reasoning with active uncertainty minimization to produce structured, clinically grounded reports. The system maps image features to probabilistic clinical concepts, composes differentiable logic-based reasoning chains, decodes those chains into templated clauses, and refines the textual output via retrieval and constrained language-model editing. An active sampling loop driven by rule-level uncertainty and diversity guides clinician-in-the-loop adjudication and promptbook refinement. Experiments on standard benchmarks demonstrate consistent improvements in factual consistency and standard language metrics compared to representative baselines.

연구 동기 및 목표

  • 자연스럽고 사실적으로 신뢰성 높으며 임상적으로 해석 가능한 자동 방사선 보고서 생성을 목표로 한다.
  • 이미지를 확률적 임상 개념에 매핑하고, 미분 가능 추론 체인을 구성하며, 템플릿화된 텍스트 출력물을 생성하는 통합 프레임워크를 개발한다.
  • 초안 정제를 위해 검색 증거와 제약된 언어 모델 편집을 도입한다.
  • 가치가 높고 불확실성이 큰 사례에 대해 임상의 검토를 우선시하기 위한 능동적 불확실성 최소화를 도입한다.
  • 대표적인 기준선 대비 표준 방사선 보고서 벤치마크에서 개선을 시연한다.

제안 방법

  • 트랜스포머 기반 개념 예측기를 통해 이미지 특징을 확률적 임상 개념으로 매핑한다.
  • AND/OR/NOT 연산자를 갖는 미분 가능한 논리 계층을 사용하여 개념 위에 미분 가능하고 연성 추론 체인을 구성한다.
  • 활성화된 소프트 규칙을 규칙 가이드 디코더로 표준 절 템플릿으로 해독한다.
  • 해독된 절에 검색 증거와 제약된 LLM 의역을 보강하여 구조화된 초안을 형성한다.
  • 검색 보강 템플릿 채움 파이프라인을 갖춘 지식, 검증자, 추론으로 구성된 다중 에이전트 오케스트레이션 시스템을 사용한다.
  • 몬테카를로 드롭아웃 기반 엔트로피 및 k-센터 다양성 샘플링을 통한 능동적 불확실성 최소화를 적용하여 임상의 루프 수정 가이드를 제공한다.
Figure 1: Architectural overview of the NeuroSymb-MRG framework for transparent and clinically grounded radiology report generation. The pipeline initiates with Visual Perception , utilizing a self-supervised visual encoder $f_{\mathrm{ve}}$ to extract patch-level features $X$ . In the Neuro-Symboli
Figure 1: Architectural overview of the NeuroSymb-MRG framework for transparent and clinically grounded radiology report generation. The pipeline initiates with Visual Perception , utilizing a self-supervised visual encoder $f_{\mathrm{ve}}$ to extract patch-level features $X$ . In the Neuro-Symboli

실험 결과

연구 질문

  • RQ1완전 신경 기반 기준선과 비교했을 때 미분 가능 신경-기호 추론 모듈이 더 사실적으로 일치하는 방사선 보고서를 생성하는가?
  • RQ2규칙 수준에서의 능동적 불확실성 최소화가 사실성 신뢰성을 높이고 임상적으로 위험한 허구를 줄이는가?
  • RQ3규칙 기반 디코더와 결합했을 때 검색 보강 및 제약된 LLM 정제가 보고 품질에 미치는 영향은 무엇인가?
  • RQ4지식 그래프(UMLS 등)를 활용한 다중 에이전트 오케스트레이션이 보고서 충실도 및 모순 처리에 어떤 영향을 미치는가?

주요 결과

방법B-1 IU X-rayB-2 IU X-rayB-3 IU X-rayB-4 IU X-rayR-L IU X-rayMTR IU X-rayB-1 MIMIC-CXRB-2 MIMIC-CXRB-3 MIMIC-CXRB-4 MIMIC-CXRR-L MIMIC-CXRMTR MIMIC-CXR
Show-Tell [27]0.2430.1300.1080.0780.3070.1570.3080.1900.1250.0880.2560.122
Transformer [26]0.3720.2510.1470.1360.3170.1680.3160.1990.1400.0920.2670.129
Att2in [24]0.2480.1340.1160.0910.3090.1620.3140.1980.1330.0950.2640.122
AdaAtt [20]0.2840.2070.1500.1260.3110.1650.3140.1980.1320.0940.2670.128
Up-Down [2]0.3170.1950.1300.0920.2670.128
M2Transformer [6]0.4020.2840.1680.1430.3280.1700.3320.2100.1420.1010.2640.134
R2Gen [5]0.4700.3040.2190.1650.3710.1870.3530.2180.1450.1030.2770.142
Contra.Attn. [19]0.4920.3140.2220.1690.3810.1930.3500.2190.1520.1090.2830.151
CMCL [17]0.4730.3050.2170.1620.3780.1860.3440.2170.1400.0970.2810.133
CMN [4]0.4750.3090.2220.1700.3750.1910.3530.2180.1480.1060.2780.142
Aligntransformer [32]0.4840.3130.2250.1730.3790.2040.3780.2350.1560.1120.2830.158
M2Tr.Prog. [21]0.4860.3170.2320.1730.3900.1920.3780.2320.1540.1070.2720.145
CMM+RL [22]0.4810.3160.2280.1810.3840.2010.3810.2320.1550.1090.2870.151
XPRONET* [28]0.4910.3250.2280.1690.3870.2020.3440.2150.1460.1050.2790.138
MCGN [30]0.4810.3160.2260.1710.3720.1900.3730.2350.1620.1200.2820.143
PPKED [18]0.4830.3150.2240.1680.3760.3600.2240.1490.1060.2840.149
RAMT [33]0.4820.3100.2210.1650.3770.1950.3620.2290.1570.1130.2840.153
R2GenGPT [29]0.4820.3060.2150.1580.3700.2000.3870.2480.1700.1230.2800.149
VLCI ${\dagger}$ [3]0.3240.2110.1510.1150.3790.1660.3570.2160.1440.1030.2560.136
PromptMRG [11]0.4010.2810.1600.3980.1120.2680.157
MedRAT [9]0.4550.3490.3650.0860.251
MRG-LLM [14]0.5290.3590.2660.2020.4080.2210.4160.2670.1820.1290.2960.163
NeuroSymb-MRG (Ours)0.6020.4250.3210.2530.4630.2750.4870.3320.2340.1750.3620.225
  • NeuroSymb-MRG는 IU X-ray 및 MIMIC-CXR에서 강력한 기준선보다 자동 지표가 더 높게 나타난다(BLEU, ROUGE-L, METEOR).
  • 규칙 수준의 미분 가능 추론과 규칙 디코더의 결합이 MLP만 사용하거나 비-기호적 기준선보다 어휘적/의미적 품질을 향상시킨다.
  • 검색 보강과 LLM 제약 단계가 이득을 제공하고 검증자를 통해 모순을 완화하는 데 도움을 준다.
  • 엔트로피 기반 샘플링과 다양성(k-center)을 통한 능동적 불확실성 최소화가 품질을 유지하면서 주석 필요성을 줄인다.
  • 지식 에이전트와 UMLS 검증을 포함한 다중 에이전트 구성이 사실성 가능성을 향상시키고 서로 충돌하는 주장를 감소시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.