[논문 리뷰] CARD: Classification and Regression Diffusion Models
CARD는 확산 기반의 조건부 생성 모델링과 사전 학습된 조건 평균 추정기를 결합하여 전체 조건부 분포 p(y|x)를 회복하며, 회귀 벤치마크에서 최첨단 성과를 달성하고 분류에 대한 인스턴스 수준의 모델 신뢰도를 제공합니다.
Learning the distribution of a continuous or categorical response variable $\boldsymbol y$ given its covariates $\boldsymbol x$ is a fundamental problem in statistics and machine learning. Deep neural network-based supervised learning algorithms have made great progress in predicting the mean of $\boldsymbol y$ given $\boldsymbol x$, but they are often criticized for their ability to accurately capture the uncertainty of their predictions. In this paper, we introduce classification and regression diffusion (CARD) models, which combine a denoising diffusion-based conditional generative model and a pre-trained conditional mean estimator, to accurately predict the distribution of $\boldsymbol y$ given $\boldsymbol x$. We demonstrate the outstanding ability of CARD in conditional distribution prediction with both toy examples and real-world datasets, the experimental results on which show that CARD in general outperforms state-of-the-art methods, including Bayesian neural network-based ones that are designed for uncertainty estimation, especially when the conditional distribution of $\boldsymbol y$ given $\boldsymbol x$ is multi-modal. In addition, we utilize the stochastic nature of the generative model outputs to obtain a finer granularity in model confidence assessment at the instance level for classification tasks.
연구 동기 및 목표
- 전체 조건부 분포 p(y|x)를 회복하는 필요성 강조: 특히 다모달 또는 불확실한 결과에 대해 조건 평균 추정만으로는 부족합니다.
- CARD를 소개합니다. 공변량 의존성과 사전 학습된 평균 추정기를 주입하는 확산 기반 조건부 생성 모델입니다.
- CARD가 p(y|x, D)를 정확히 추정하고 벤치마크에서 최첨단 불확실성 추정 방법을 능가한다는 것을 보입니다.
- 분포 인지 평가 지표를 새롭게 제시하고 분류 작업에서 인스턴스 수준의 모델 신뢰도를 입증합니다.
제안 방법
- CARD를 순방향 프로세스 q(y_t|y_{t-1}, x)와 역방향 프로세스 p_theta(y_{t-1}|y_t, x)을 갖는 디노이징 확산 확률 모델로 형식화합니다.
- 끝점 확산 분포 p(y_T|x)는 평균 f_phi(x)인 Gaussian이며, f_phi는 사전 학습된 조건부 평균 추정기입니다.
- 해석 가능한 순방향 프로세스와 학습된 디노이징 네트워크 epsilon_theta를 사용하여 L_0, L_{t-1}, L_T로 분해되는 ELBO 목표로 학습합니다.
- 회귀의 경우 표준 DDPM 샘플링 단계로 y_0를 재구성하기 위해 확산 노이즈 epsilon_theta를 예측합니다. f_phi는 E[y|x]에서 사전 학습합니다.
- 분류의 경우 y_0를 원-핫으로 사용하고 클래스 프로토타입을 연속 타깃으로 간주합니다. diffusion 출력은 제곱 오차 기반 매핑(Eq. 10)을 통한 온도 가중 Softmax로 클래스 확률로 변환합니다.
- 인스턴스 수준의 분류 신뢰도 평가를 제공하기 위해 다중 재구성을 샘플링하고 예측 구간 및 확률 차이의 유의성을 분석합니다.
실험 결과
연구 질문
- RQ1확산 기반의 조건부 생성 모델이 합산 잡음이나 매개변수적 불확실성 모델보다 전체 조건부 분포 p(y|x)를 더 정확하게 회복할 수 있습니까?
- RQ2CARD가 다모달 조건부 분포에 대해 신뢰할 수 있는 불확실성 추정치를 제공하고 분류에서 더 미세한 인스턴스 수준의 신뢰도를 제공합니까?
- RQ3표준 벤치마크에서 회귀 및 분류 성능과 분포 지표가 베이지안 신경망 및 관련 생성적 접근법과 어떻게 비교됩니까?
주요 결과
- CARD는 p(y|x, D)를 정확히 추정하며 RMSE, NLL, QICE 지표에서 회귀 벤치마크에서 종종 최첨단 성과를 달성합니다.
- 학습된 분포가 True conditional distribution과 얼마나 잘 일치하는지 평가하기 위한 새로운 분포 중심 평가 지표(QICE)가 도입됩니다. 특히 다모달인 경우에 유용합니다.
- CARD는 실제 세계의 UCI 회귀 데이터셋에서 강력한 성능을 보이며 여러 데이터셋과 지표에서 종종 최상위 또는 근사 최상위를 차지합니다.
- 분류에서 CARD는 다중 클래스 프로토타입 재구성을 생성하고 예측 구간 및 클래스 확률 차이의 유의성을 평가하여 인스턴스 수준의 신뢰성 평가를 가능하게 합니다.
- 이 방법은 확산 출력의 확률적 특성을 활용하여 교정된 불확실성과 점 추정치를 넘어서는 의미 있는 신뢰도 측정을 제공합니다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.