QUICK REVIEW

[논문 리뷰] Uncertainty-Aware Diffusion Model for Multimodal Highway Trajectory Prediction via DDIM Sampling

Marion Neumeier, Niklas Roßberg|arXiv (Cornell University)|2026. 02. 24.

Autonomous Vehicle Technology and Safety인용 수 0

한 줄 요약

이 논문은 고속, 불확실성 인식 다중 모드 고속 도로 예측 프레임워크인 cVMDx를 제안하며, 시나리오 인코딩에 CVQ-VAE를 통합하고, 효율성을 위해 DDIM 샘플링을 활용하며, 다중 모드 출력을 위해 Gaussian mixtures를 사용한다.

ABSTRACT

Accurate and uncertainty-aware trajectory prediction remains a core challenge for autonomous driving, driven by complex multi-agent interactions, diverse scene contexts and the inherently stochastic nature of future motion. Diffusion-based generative models have recently shown strong potential for capturing multimodal futures, yet existing approaches such as cVMD suffer from slow sampling, limited exploitation of generative diversity and brittle scenario encodings. This work introduces cVMDx, an enhanced diffusion-based trajectory prediction framework that improves efficiency, robustness and multimodal predictive capability. Through DDIM sampling, cVMDx achieves up to a 100x reduction in inference time, enabling practical multi-sample generation for uncertainty estimation. A fitted Gaussian Mixture Model further provides tractable multimodal predictions from the generated trajectories. In addition, a CVQ-VAE variant is evaluated for scenario encoding. Experiments on the publicly available highD dataset show that cVMDx achieves higher accuracy and significantly improved efficiency over cVMD, enabling fully stochastic, multimodal trajectory prediction.

연구 동기 및 목표

고속도로 궤적 예측의 본질적으로 확률적이고 다중 모드인 특성을 다룬다.
실용적인 다중 샘플 불확실성 추정이 가능하도록 샘플링 효율성을 개선한다.
코드북 붕괴를 줄이고 강인성을 향상시키기 위해 시나리오 표현을 강화한다.
생성된 궤도에 가우시안 혼합 모델을 적합시켜 명시적 다중 모드 예측을 제공한다.

제안 방법

VQ-VAE를 CVQ-VAE로 교체하여 시나리오 인코딩에서 코드북 붕괴를 완화하는 방식으로 cVMD를 확장한다.
다중 샘플 생성을 위해 DDPM보다 최대 100배 빠른 추론을 달성하도록 DDIM 샘플링을 사용한다.
캡처된 확산 궤도를 가우시안 혼합 모델에 적용하여 여러 모션 가설을 추출하고 표현한다.
훈련 안정성과 샘플 일관성을 위해 속도 기반 학습 목표를 도입한다.
시나리오-맥락 불확실성과 확산 타임스텝에 의해 조건화 강도가 조절되는 불확실성 인식 가능한 classifier-free 가이던스를 구현한다.
highD 데이터셋에서 평가하고 기준 확산(확산 기반) 및 비확산 궤도 예측기와 비교한다.

실험 결과

연구 질문

RQ1확산 기반 궤도 모델을 어떻게 더 빠르게 만들고 고속도로 시나리오에 대한 다중 모드 미래를 더 잘 포착하도록 만들 수 있는가?
RQ2CVQ-VAE 기반 시나리오 조건화가 코드북 붕괴를 줄이고 예측의 강인성을 향상시킬 수 있는가?
RQ3속도 기반 학습 목표가 확산 기반 궤도 예측에서 안정성과 샘플 품질을 향상시키는가?
RQ4DDIM 샘플링이 자율주행 궤도에서 실용적인 다중 샘플 불확실성 추정을 얼마나 효과적으로 가능하게 하는가?
RQ5GMM이 확산으로 생성된 다중 모드 분포를 명시적 모션 가설로 효과적으로 요약할 수 있는가?

주요 결과

cVMDx는 DDIM 샘플링으로 기존의 확산 기반 방법 대비 최대 100× 빠른 추론을 달성한다.
CVQ-VAE는 코드북 붕괴를 완화하고 강인한 시나리오 임베딩을 생성하며, 이 설정에서 표준 VQ-VAE에 비해 미세한 이득을 제공한다.
가우시안 혼합 모델은 생성된 샘플로부터 여러 미래 모션 가설을 추출하고 표현할 수 있다.
속도 기반 목표가 확산 기반 궤도 예측에서 훈련 안정성과 샘플 일관성을 향상시킨다.
샘플의 집계(평균 또는 K개 중 최선)의 성능은 단일 샘플 기준선보다 ADE를 향상시키지만, 반드시 FDE를 향상시키지는 않으며, 다중 모드의 이점을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.