QUICK REVIEW

[논문 리뷰] Predicting Weather Uncertainty with Deep Convnets

Peter Grönquist, Tal Ben‐Nun|arXiv (Cornell University)|2019. 11. 02.

Meteorological Phenomena and Simulations인용 수 7

한 줄 요약

이 논문은 수치 wea ther 예측(NWP)에서 예측 불확실성의 계산 비용을 최소화하기 위해 소수의 수치 기상 시뮬레이션에서 학습함으로써 3D 컨volution 신경망(Convnets)을 사용하여 기상 예측 불확실성을 예측하는 방법을 제안한다. 3D U-Net 아키텍처를 변형하고 공간적 및 시간적 동역학을 통합함으로써, 단 한 개의 Perturbed 시뮬레이션을 사용함으로써 다섯 개의 앙상블 경로와 유사한 산란 추정 정확도를 달성하여 대규모 앙상블 실행이 크게 줄어들게 된다.

ABSTRACT

Modern weather forecast models perform uncertainty quantification using ensemble prediction systems, which collect nonparametric statistics based on multiple perturbed simulations. To provide accurate estimation, dozens of such computationally intensive simulations must be run. We show that deep neural networks can be used on a small set of numerical weather simulations to estimate the spread of a weather forecast, significantly reducing computational cost. To train the system, we both modify the 3D U-Net architecture and explore models that incorporate temporal data. Our models serve as a starting point to improve uncertainty quantification in current real-time weather forecasting systems, which is vital for predicting extreme events.

연구 동기 및 목표

대규모 앙상블 시스템을 딥 러닝으로 대체함으로써 수치 기상 예측(NWP)에서 불확실성 정량화의 계산 부담을 줄이기 위해.
딥 러닝 모델이 단 한 개의 unperturbed 경로를 포함한 소수의 시뮬레이션만으로도 정확하게 예측 산란을 추정할 수 있는지 탐색하기 위해.
3D U-Net 및 하이브리드 아키텍처(예: CNN-LSTM)가 다중 압력 수준 대기 데이터의 공간적 및 시간적 의존성을 모델링하는 데 얼마나 효과적인지 평가하기 위해.
실시간 기상 예측을 위해 전체 앙상블 산란을 근사하기 위해 딥 러닝을 사용하는 것이 실현 가능한지 평가하기 위해.

제안 방법

압력 수준과 격자 점을 통해 공간 정보를 유지하기 위해 잔차(skip) 연결을 갖춘 3D U-Net 아키텍처를 변형하였다.
다중 대기 변수 및 압력 수준 간의 공간적 관계를 모델링하기 위해 애핀 컨volution(affine convolutions)를 통합하였다.
이전 시간 단계의 정보를 기반으로 향후 시간 단계(t = 3h, 6h)의 예측 산란을 예측하기 위해 CNN-LSTM 아키텍처를 사용하여 시간 모델링을 수행하였다.
2000–2011년의 ERA5 재분석 데이터를 사용하여 훈련을 수행하였으며, 테스트 세트로 2010–2011년을 사용하고, 훈련/검증에 대해 80/20 비율로 데이터를 분할하고 시간적 편향을 방지하기 위해 셔플링을 수행하였다.
고해상도 전 세계 데이터를 처리하기 위해 분산 데이터 병렬 훈련을 사용하였으며, 확장성을 고려해 파이프라인 및 모델 병렬화로의 확장 계획이 수립되어 있다.
7개의 압력 수준과 40×136 공간 격자 점에서 온도, 바람, 수증기 등 다양한 입력 데이터를 표준화하였고, 효율적인 훈련을 위해 TFRecord 형식으로 저장하였다.

실험 결과

연구 질문

RQ1단 한 개의 unperturbed 시뮬레이션에서 학습된 딥 러닝 모델이 대규모 앙상블 예측 시스템의 산란을 높은 정확도로 근사할 수 있는가?
RQ23D U-Net 및 하이브리드 CNN-LSTM 아키텍처는 대기 불확실성의 공간적 및 시간적 동역학을 얼마나 효과적으로 모델링하는가?
RQ3초기 조건(예: 바람, 수증기 등)을 통합하면 아키텍처 자체만으로는 불확실성 추정 성능을 향상시키는 데 도움이 되는가?
RQ4입력 경로 수가 증가함에 따라 모델 성능은 어떻게 변화하며, 전체 앙상블의 정확도에 도달하는가?
RQ5수치 기상 시뮬레이션을 여러 번 실행하는 것과 비교해 딥 러닝을 사용한 불확실성 정량화의 계산적 이점은 무엇인가?

주요 결과

기본 3D U-Net 모델은 단 한 개의 unperturbed 경로만을 사용하여 네 개의 perturbed 앙상블 구성원과 유사한 산란 추정 정확도를 달성하였다.
다중 압력 수준 입력 처리를 통한 공간 효과 통합으로 다섯 개의 앙상블 경로와 유사한 성능를 확보하였으며, ERA5 앙상블 크기의 절반 수준에 도달하였다.
시간 모델링을 추가함으로써 t = 6h 예측에서 성능 향상을 보였으며, 이는 시간적 동역학이 불확실성 추정에 있어 가치가 있음을 시사한다.
ENS10 데이터셋(10개 구성원 앙상블)에서, 다섯 개 이상의 입력 경로를 초과하면 성능 향상의 감소가 나타나며, 이는 작은 앙상블 크기로 인한趋세(포화)를 시사한다.
단일 V100 GPU에서 7개의 압력 수준과 하나의 대기 변수에 대해 약 15ms 내로 2일 예측을 수행한 반면, 51명의 앙상블에 대해 Cray XC40 슈퍼컴퓨터에서는 1시간이 소요되었다.
소량의 성능 향상에 그치지만, 초기 조건을 입력으로 넣는 것이 아키텍처 설계보다 영향을 적게 미치며, 이는 모델 구조가 예측 성능를 지배함을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.