QUICK REVIEW

[논문 리뷰] Theoretical Foundations of Latent Posterior Factors: Formal Guarantees for Multi-Evidence Reasoning

Aliyu Agboola Alege|arXiv (Cornell University)|2026. 03. 13.

Explainable Artificial Intelligence (XAI)인용 수 0

한 줄 요약

이 연구는 SPN 및 학습 집계기를 사용하여 다중 증거 예측에서 Latent Posterior Factors (LPF)에 대한 일곱 가지 형식 보장을 제공하고, 다양한 도메인에 걸친 광범위한 실증 검증을 제시한다.

ABSTRACT

We present a complete theoretical characterization of Latent Posterior Factors (LPF), a principled framework for aggregating multiple heterogeneous evidence items in probabilistic prediction tasks. Multi-evidence reasoning arises pervasively in high-stakes domains including healthcare diagnosis, financial risk assessment, legal case analysis, and regulatory compliance, yet existing approaches either lack formal guarantees or fail to handle multi-evidence scenarios architecturally. LPF encodes each evidence item into a Gaussian latent posterior via a variational autoencoder, converting posteriors to soft factors through Monte Carlo marginalization, and aggregating factors via exact Sum-Product Network inference (LPF-SPN) or a learned neural aggregator (LPF-Learned). We prove seven formal guarantees spanning the key desiderata for trustworthy AI: Calibration Preservation (ECE <= epsilon + C/sqrt(K_eff)); Monte Carlo Error decaying as O(1/sqrt(M)); a non-vacuous PAC-Bayes bound with train-test gap of 0.0085 at N=4200; operation within 1.12x of the information-theoretic lower bound; graceful degradation as O(epsilon*delta*sqrt(K)) under corruption, maintaining 88% performance with half of evidence adversarially replaced; O(1/sqrt(K)) calibration decay with R^2=0.849; and exact epistemic-aleatoric uncertainty decomposition with error below 0.002%. All theorems are empirically validated on controlled datasets spanning up to 4,200 training examples. Our theoretical framework establishes LPF as a foundation for trustworthy multi-evidence AI in safety-critical applications.

연구 동기 및 목표

레이블을 예측하기 위해 여러 개의 노이즈가 있는 소스를 모아야 하는 다중 증거 예측을 고무한다.
VAE를 통해 각 증거 항목을 가우시안 잠재 후방으로 인코딩하기 위해 LPF를 도입한다.
정확한 SPN 기반 및 학습된 집계 방법을 형식적 보장과 함께 제공한다.
데이터 효율적인 보정, 견고성 및 불확실성 분해 보장을 확립한다.
이론적 결과를 8개 다양한 도메인에 걸쳐 높은 정확도와 낮은 보정 오차로 실증적으로 검증한다.

제안 방법

각 증거 항목을 변분 오토인코더를 사용하여 가우시안 포스터리어로 인코딩한다.
잠재 변수의 몬테카를로 주변화에 의해 포스터리어를 소프트 팩터로 변환한다.
요소를 정확한 SPN 추론(LPF-SPN)이나 학습된 신경 집계기(LPF-Learned)로 합친다.
보정, 몬테카를로 오차, 일반화, 정보 이론적 최적성, 견고성, 샘플 복잡성 및 불확실성 분해를 포함하는 7개의 형식적 보장을 증명한다.
8개 도메인에 걸친 최대 4,200개의 학습 샘플로 제어된 실험을 통해 보장을 검증하고, 정확도 및 보정 지표를 보고한다.

실험 결과

연구 질문

RQ1다른 여러 이질적 증거 항목을 형식적 보장이 있는 보정된 예측 분포로 융합할 수 있는가?
RQ2LPF-SPN과 LPF-Learned가 다중 증거 설정에서 신뢰할 수 있는 보정, 견고성 및 불확실성 분해를 달성하는가?
RQ3증거 수가 변할 때 LPF 집계기의 데이터 효율성 및 일반화 특성은 어떤가?

주요 결과

LPF는 여덟 도메인에서 평균 정확도 99.3% 및 기대 보정 오차(ECE) 1.5%를 달성한다.
LPF-SPN은 ECE가 ε에 의해 경계지어지고 C/sqrt(K_eff)로 스케일링되는 항으로 보정 상태를 유지한다.
몬테 카를로 팩터 근사 오차는 O(1/sqrt(M))로 감소한다.
학습된 집계기는 N=4200에서 훈련-테스트 간 차이가 0.0085인 비공허 PAC-Bayes 일반화 경계를 달성한다.
LPF는 보정 오차에 대한 정보 이론적 하한보다 1.12배 이내이며, 증거 훼손 하에서도 완만한 악화로 견고한 성능을 보인다.
불확실성은 정확하게 에피스템틱과 알레이토릭 구성요소로 분해되며(분해 오차 < 0.002%).

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.