QUICK REVIEW

[논문 리뷰] A data-driven approach to precipitation parameterizations using convolutional encoder-decoder neural networks

Pablo Larraondo, Luigi J. Renzullo|arXiv (Cornell University)|2019. 03. 25.

Meteorological Phenomena and Simulations인용 수 25

한 줄 요약

이 논문은 지면지수 높이만을 사용하여 총 강수량을 추정하기 위해 데이터 기반 접근법을 제안하며, 이러한 모델이 대기 필드 내 복잡한 공간적 관계를 높은 정확도로 학습할 수 있음을 보여준다. 이 방법은 기존의 기계학습 모델보다 뛰어난 성능을 보이며, 강수량 예측에 가장 영향을 미치는 주요 대기 수준을 특정한다.

ABSTRACT

Numerical Weather Prediction (NWP) models represent sub-grid processes using parameterizations, which are often complex and a major source of uncertainty in weather forecasting. In this work, we devise a simple machine learning (ML) methodology to learn parameterizations from basic NWP fields. Specifically, we demonstrate how encoder-decoder Convolutional Neural Networks (CNN) can be used to derive total precipitation using geopotential height as the only input. Several popular neural network architectures, from the field of image processing, are considered and a comparison with baseline ML methodologies is provided. We use NWP reanalysis data to train different ML models showing how encoder-decoder CNNs are able to interpret the spatial information contained in the geopotential field to infer total precipitation with a high degree of accuracy. We also provide a method to identify the levels of the geopotential height that have a higher influence on precipitation through a variable selection process. As far as we know, this paper covers the first attempt to model NWP parameterizations using CNN methodologies.

연구 동기 및 목표

수치 wea ther 예측(NWP)에서 지면지수 높이만을 입력으로 사용하여 강수량 파rameterization을 기계학습 기반으로 유도하는 방법을 개발한다.
지면지수 높이와 총 강수량 간의 공간적 관계를 학습하는 데에 콘볼루션 인코더-디코더 신경망(CNN)의 성능을 평가한다.
선형 회귀 및 랜덤 포레스트와 같은 전통적 기계학습 방법과 비교하여 딥 러닝 모델의 예측 정확도를 평가한다.
변수 선택 과정을 통해 지면지수 높이의 어떤 대기 수준이 강수량 추정에 가장 중요한 영향을 미치는지 특정한다.
단일 기본 NWP 필드에서 복잡한 비선형 강수 패턴을 학습할 수 있음을 보이며, 딥 러닝 기반의 NWP 파rameterization 잠재력에 대해 강조한다.

제안 방법

컴퓨터 비전에서 영감을 받은 아키텍처를 사용하여 2차원 지면지수 높이 필드를 총 강수량 필드로 매핑하는 데에 콘볼루션 인코더-디코더 신경망(CNN)을 활용한다.
다양한 대기 수준의 지면지수 높이를 입력으로 사용하여 유럽 지역을 넓게 포함한 40년간의 ERA-Interim 재분석 데이터를 기반으로 모델을 훈련한다.
패치 기반 훈련 전략을 적용하여 지면지수 필드의 국소적 공간 영역을 사용해 해당 지역의 강수량 값을 예측한다.
지면지수 높이의 어떤 대기 수준이 정확한 강수량 추정에 가장 기여하는지 특정하기 위해 변수 선택 과정을 적용한다.
최신의 상태 기술 CNN 아키텍처를 여러 개 평가하여 강수량 예측에 가장 우수한 성능을 보이는 모델을 도출한다.
선형 회귀, LASSO, 랜덤 포레스트와 같은 기준 모델과 비교하여 성능을 평가하며, 선택된 테스트 지역에서 상관관계 및 RMSE 등의 지표를 사용한다.

실험 결과

연구 질문

RQ1콘볼루션 인코더-디코더 네트워크는 추가적인 물리적 필드 없이 지면지수 높이만으로 총 강수량을 예측할 수 있는가?
RQ2지면지수 높이 필드에서 강수량을 추정하는 데에 가장 우수한 성능을 보이는 인코더-디코더 CNN 아키텍처는 무엇인가?
RQ3지면지수 높이의 어떤 대기 수준이 강수량 예측에 가장 정보를 제공하는가?
RQ4이 강수량 추정 작업에서 딥 러닝 모델의 성능은 기존의 기계학습 방법과 비교해 어떻게 다른가?
RQ5지면지수 높이의 공간적 및 대기역학적 패턴을 얼마나 잘 활용하여 복잡한 강수량 필드를 추론할 수 있는가?

주요 결과

수정된 U-Net 인코더-디코더 아키텍처가 모든 테스트된 CNN 모델 중에서 총 강수량 필드를 재현하는 데 가장 높은 정확도를 기록했다.
인코더-디코더 CNN 모델은 기존의 기계학습 모델보다 뚜렷한 성능 우위를 보였으며, 최고 성능을 보인 모델의 상관계수는 0.52를 초과했다.
랜덤 포레스트 모델은 선형 모델 대비 개선이 있었지만, 강수량 패턴의 국소적 날카움과 구조를 포착하지 못했다.
변수 선택 과정을 통해 정확한 강수량 추정에 가장 기여하는 특정 대기 수준의 지면지수 높이를 성공적으로 특정했다.
다른 물리 변수(습도, 기온 등) 없이 지면지수 높이만을 사용함에도 불구하고, 최고 성능을 보인 CNN 모델이 대규모 및 메조스케일 강수 특징을 높은 공간 정밀도로 포착했다.
결과적으로 딥 러닝 모델은 다른 물리 변수가 없더라도 지면지수 높이와 강수량 간의 복잡한 비선형 관계를 효과적으로 추출할 수 있음을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.