Skip to main content
QUICK REVIEW

[논문 리뷰] SEEDS: Emulation of Weather Forecast Ensembles with Diffusion Models

Lizao Li, Robert W. Carver|arXiv (Cornell University)|2023. 06. 24.
Meteorological Phenomena and Simulations인용 수 9
한 줄 요약

SEEDS는 확산 모델을 사용해 소수의 운영 예보를 조건으로 큰 기상 유사 예측 앙상블을 생성하고, 훨씬 적은 계산으로 동등하거나 더 나은 예측 능력을 달성한다.

ABSTRACT

Uncertainty quantification is crucial to decision-making. A prominent example is probabilistic forecasting in numerical weather prediction. The dominant approach to representing uncertainty in weather forecasting is to generate an ensemble of forecasts. This is done by running many physics-based simulations under different conditions, which is a computationally costly process. We propose to amortize the computational cost by emulating these forecasts with deep generative diffusion models learned from historical data. The learned models are highly scalable with respect to high-performance computing accelerators and can sample hundreds to tens of thousands of realistic weather forecasts at low cost. When designed to emulate operational ensemble forecasts, the generated ones are similar to physics-based ensembles in important statistical properties and predictive skill. When designed to correct biases present in the operational forecasting system, the generated ensembles show improved probabilistic forecast metrics. They are more reliable and forecast probabilities of extreme weather events more accurately. While this work demonstrates the utility of the methodology by focusing on weather forecasting, the generative artificial intelligence methodology can be extended for uncertainty quantification in climate modeling, where we believe the generation of very large ensembles of climate projections will play an increasingly important role in climate risk assessment.

연구 동기 및 목표

  • numerical weather prediction에서 대규모 앙상블로 예측 불확실성 정량화.
  • 제한된 시드에서 물리 기반 앙상블 분포를 모사하는 확장 가능한 생성 방법 개발.
  • 앙상블의 편향 보정을 위한 대체 데이터 소스와의 혼합을 통한 후처리 가능화.
  • 생성된 앙상블이 핵심 역량 지표에서 물리 기반 앙상블에 맞먹거나 능가함을 입증.
  • 생성된 앙상블의 신뢰성 및 극값 표현 평가.

제안 방법

  • K개의 시드 예보를 조건으로 하여 N>K개의 기상 상태 샘플을 생성하는 확산 기반 생성 모델 학습.
  • Cubed-sphere 격자에서 표준화된 이상치로 대기 데이터를 표현하고 axial 주의가 있는 ViT에서 영감을 받은 스코어 네트워크를 사용.
  • 두 가지 학습 과제: 생성적 앙상블 모사(시드에서 p(v) 모사) 및 생성적 후처리(α p(v) + (1−α) p′(v) 근사).
  • 훈련 및 평가를 위해 GEFS 재예보 20년과 ERA5 재분석 데이터를 사용.
  • ERA5-HRES 기준으로 순위 히스토그램, RMSE, ACC, CRPS, 극값(±2σ) 기술을 사용해 평가.
Figure 1: Illustration of the target distributions of generative ensemble emulation ( gefs-full ) and post-processing (Mixture). Shown are the histograms (bars: frequencies with 12 shared bins, curves: Gaussian kernel density estimators fit to the bars), i.e . , the empirical distributions of the su
Figure 1: Illustration of the target distributions of generative ensemble emulation ( gefs-full ) and post-processing (Mixture). Shown are the histograms (bars: frequencies with 12 shared bins, curves: Gaussian kernel density estimators fit to the bars), i.e . , the empirical distributions of the su

실험 결과

연구 질문

  • RQ1확산 기반 에뮬레이터가 소수의 시드 예보에서 물리 기반 GEFS 앙상블의 통계적 특성을 재현하는 대규모 앙상블을 생성할 수 있는가?
  • RQ2생성적 후처리(ERA5 데이터와의 혼합)가 물리 기반 앙상블만 사용하는 것보다 신뢰성과 극값 예측을 개선하는가?
  • RQ3생성된 앙상블이 공간적 일관성, 다변량 상관관계, 스펙트럴 특성 측면에서 기준값과 어떻게 비교되는가?
  • RQ4SEEDS를 사용해 수백~수천 개의 앙상블 멤버를 생성할 때 컴퓨팅 효율은 얼마나 향상되는가?

주요 결과

  • 생성된 앙상블(seeds-gee 및 seeds-gpp)은 GEFS-full 및 ERA5와 유사한 공분산 구조와 에너지 스펙트럼을 가지는 기상 유사 샘플을 달성하며, 현실적인 공간 패턴을 포함한다.
  • Seeds-gee는 RMSE, ACC, CRPS에서 gefs-full에 대해 유사한 기술을 달성하고, seeds-gpp는 근표면 온도 및 극값 커버리지에서 종종 gefs-full을 능가한다.
  • 생성적 후처리(seeds-gpp)는 전체 물리 기반 앙상블보다 최하위 순위 히스토그램 불확실성 δ가 낮고 극값 분류(Brier 점수)가 더 우수한 가장 높은 신뢰성을 제공한다.
  • 2개의 시드 예보만 사용해 배치당 3분( TPUv3)으로 추가 계산 없이 512명의 멤버를 생성할 수 있어 매우 큰 앙상블이 가능하다.
  • 생성된 앙상블은 꼬리 이벤트를 더 잘 포착하고 시드 바깥의 envelopes를 확장하여 희귀 사건에 대한 불확실성 정량화를 돕는다.
  • 리드 타임이 최대 16일에 이르는 동안 생성 앙상블은 전체 GEFS 앙상블과의 강한 상관관계를 보여 단순한 기후통계학을 넘어선 동역학을 학습한다.
Figure 2: Maps of total column vertically-integrated water vapor ( $kg/m^{2}$ ) for 2022/07/14, as captured by (top left) the ERA5 reanalysis, (top right and middle row) 5 members of the gefs-full forecast issued with a 7-day lead time, and (bottom) 3 samples from seeds-gee . The top 2 GEFS forecast
Figure 2: Maps of total column vertically-integrated water vapor ( $kg/m^{2}$ ) for 2022/07/14, as captured by (top left) the ERA5 reanalysis, (top right and middle row) 5 members of the gefs-full forecast issued with a 7-day lead time, and (bottom) 3 samples from seeds-gee . The top 2 GEFS forecast

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.