Skip to main content
QUICK REVIEW

[논문 리뷰] Robust Non-Parametric Mortality and Fertility Modelling and Forecasting: Gaussian Process Regression Approaches

Ka Kin Lam, Bo Wang|arXiv (Cornell University)|2021. 03. 09.
Insurance, Mortality, Demography, Risk Management참고 문헌 37인용 수 8
한 줄 요약

이 논문은 자연 스퍼블린 평균 함수와 스펙트럴 혼합 공분산을 갖는 비모수적 가우시안 프로세스 회귀 모델을 제안하여 사망률 및 출산율 예측에 대해 강건한 성능을 달성한다. 각 연령별 비율을 시간에 대한 가우시안 프로세스로 모델링함으로써, 10개의 선진국에서 단기, 중기, 장기 예측 정확도가 모두 향상되었으며, Lee-Carter 및 Hyndman-Ullah와 같은 주류 모델보다 사망률 및 출산율 예측 과제에서 모두 뛰어난 성능을 보였다.

ABSTRACT

A rapid decline in mortality and fertility has become major issues in many developed countries over the past few decades. An accurate model for forecasting demographic movements is important for decision making in social welfare policies and resource budgeting among the government and many industry sectors. This article introduces a novel non-parametric approach using Gaussian process regression with a natural cubic spline mean function and a spectral mixture covariance function for mortality and fertility modelling and forecasting. Unlike most of the existing approaches in demographic modelling literature, which rely on time parameters to determine the movements of the whole mortality or fertility curve shifting from one year to another over time, we consider the mortality and fertility curves from their components of all age-specific mortality and fertility rates and assume each of them following a Gaussian process over time to fit the whole curves in a discrete but intensive style. The proposed Gaussian process regression approach shows significant improvements in terms of forecast accuracy and robustness compared to other mainstream demographic modelling approaches in the short-, mid- and long-term forecasting using the mortality and fertility data of several developed countries in the numerical examples.

연구 동기 및 목표

  • 전체 곡선을 시간에 따라 이동시키는 데 의존하는 전역 시간 매개변수에 기반한 모수적 및 반모수적 인구통계 모델의 한계를 해결한다.
  • 구조적 변화나 이질적 관측치가 존재하는 상황에서도 사망률 및 출산율 추세의 예측 정확도와 강건성을 향상시킨다.
  • 각 연령별 비율이 시간에 따라 독립적으로 확률적 과정으로 진화할 수 있도록 하는 유연하고 데이터 기반의 접근법을 개발한다.
  • 다양한 인구통계 데이터 세트에서 단기, 중기, 장기 예측 성능에서 모델의 우월성을 입증한다.
  • 강력한 모수적 가정을 피하면서도 분석적 취급 가능성과 불확실성 정량화를 유지하는 비모수적 대안을 제공한다.

제안 방법

  • 각 연령별 사망률 및 출산율을 시간에 대한 별개의 가우시안 프로세스로 모델링하여, 서로 독립적이고 동일한 분포를 가진 확률적 과정으로 간주한다.
  • 국소적 추세를 포착하고 관측된 데이터를 초월한 부드럽고 선형적인 외삽을 보장하기 위해 자연 스퍼블린을 평균 함수로 사용한다.
  • 고정된 모수적 형태를 가정하지 않고 복잡한 비선형성 및 주기적 패턴을 모델링하기 위해 스펙트럴 혼합 공분산 함수를 적용한다.
  • 베이지안 추론을 통해 미래 곡선에 대한 사후 분포를 추정함으로써 완전한 예측 분포와 예측 구간을 가능하게 한다.
  • 다양한 예측 수준과 국가에서의 예측 성능 평가를 위해 윈도우를 이동시키는 교차검증 프레임워크를 적용한다.
  • 모수 최적화를 위해 우도 최대화를 활용하여 과적합을 방지하면서도 국지적 데이터 특성에 모델이 적응하도록 보장한다.

실험 결과

연구 질문

  • RQ1자연 스퍼블린 평균과 스펙트럴 혼합 공분산을 갖는 비모수적 가우시안 프로세스 회귀 모델이 사망률 및 출산율 예측에서 주류 모수적 모델보다 뛰어난 성능을 보일 수 있는가?
  • RQ2Lee-Carter와 같은 시간 매개변수 기반 모델과 비교해, 제안된 모델은 인구통계 데이터의 구조적 변화나 이질적 관측치를 어떻게 다루는가?
  • RQ3각 연령군을 별개의 시계열로 모델링하는 것이 전역 곡선 이동 기반 접근법에 비해 예측 강건성을 향상시키는가?
  • RQ4실제로 선진국의 데이터에서 단기, 중기, 장기 예측 수준에서 모델의 성능은 어떠한가?
  • RQ5스펙트럴 혼합 공분산 함수가 사망률 및 출산율 추세의 비선형성과 주기적 동역학을 얼마나 잘 포착하는가?

주요 결과

  • 제안된 가우시안 프로세스 회귀(GPR) 모델은 사망률 및 출산률 데이터에서 Lee-Carter, BMS, HU, LM 모델과 비교해 모든 예측 수준에서 예측 오차를 크게 감소시켰다.
  • 사망률 예측에서 GPR 모델은 10개의 선진국에서 단기 및 중기 예측 수준에서 평균 RMSE가 가장 낮았으며, 영국 및 미국 남성 사망률 데이터에서 특히 뛰어난 성능를 보였다.
  • 출산율 예측에서 GPR 모델은 단기 및 중기 예측 수준에서 평균 RMSE가 가장 작았고, 15년 예측 수준에서는 Hyndman-Ullah 모델과 동등한 성능를 기록했다.
  • 장기 20년 출산율 예측에서 Hyndman-Ullah 모델이 약간 더 뛰어난 성능를 보였는데, 이는 노이즈가 많은 출산율 데이터를 더 잘 다루는 내장된 스무딩 기능 때문일 것이다.
  • GPR 모델은 더 뛰어난 강건성을 보였다: 잘못된 예측은 전체 곡선의 형태를 왜곡시키지 않고 개별 연령군에만 영향을 미쳤다. 반면 전역 시간 매개변수에 의존하는 모델은 전체 곡선의 왜곡을 야기했다.
  • 스펙트럴 혼합 공분산 함수는 비선형성과 주기적 패턴을 효과적으로 포착하여, 사전 모수적 가정이 필요 없이도 모델의 유연성과 적합도를 향상시켰다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.