Skip to main content
QUICK REVIEW

[논문 리뷰] Latent Estimation of GDP, GDP per capita, and Population from Historic and Contemporary Sources

Christopher J. Fariss, Charles Crabtree|arXiv (Cornell University)|2017. 06. 04.
Economic and Technological Innovation인용 수 33
한 줄 요약

이 논문은 1500년에서 2015년 사이의 국가-년도 단위에 대해 국내총생산(GDP), 인당 국내총생산, 그리고 인구를 추정하기 위해 역사를 거슬러 올라가는 데이터와 현대 데이터를 통합하는 동적이고 3차원 잠재적 특성 모델을 제안한다. 여러 지표를 활용하고 사후 예측 구간을 생성함으로써, 측정 정확도를 향상시키고 추정 불확실성을 정량화하며, 사회과학 연구에 원칙적이고 확장 가능한 프레임워크를 제공한다.

ABSTRACT

The concepts of Gross Domestic Product (GDP), GDP per capita, and population are central to the study of political science and economics. However, a growing literature suggests that existing measures of these concepts contain considerable error or are based on overly simplistic modeling choices. We address these problems by creating a dynamic, three-dimensional latent trait model, which uses observed information about GDP, GDP per capita, and population to estimate posterior prediction intervals for each of these important concepts. By combining historical and contemporary sources of information, we are able to extend the temporal and spatial coverage of existing datasets for country-year units back to 1500 A.D through 2015 A.D. and, because the model makes use of multiple indicators of the underlying concepts, we are able to estimate the relative precision of the different country-year estimates. Overall, our latent variable model offers a principled method for incorporating information from different historic and contemporary data sources. It can be expanded or refined as researchers discover new or alternative sources of information about these concepts.

연구 동기 및 목표

  • 기존의 국내총생산, 인당 국내총생산, 그리고 인구 측정치가 단순화된 모델링이나 데이터 제약으로 인해 심각한 오차를 포함하고 있다는 점이 점점 더 우려되는 데에 대응하기 위해.
  • 다양한 역사적 및 현대 데이터를 융합함으로써 국가-년도 추정치의 시간적 및 공간적 범위를 기원전 1500년까지 확장하기 위해.
  • 경제적 및 인구통계적 지표의 측정 오차와 불확실성을 고려하는 원칙적인 통계적 프레임워크를 개발하기 위해.
  • 동일한 잠재적 개념의 여러 지표를 모델링함으로써 각 국가-년도 추정치의 상대적 정밀도를 추정하기 위해.
  • 새로운 데이터 소스가 이용 가능하거나 발견될 경우에 대비해 쉽게 업데이트하거나 확장할 수 있는 유연하고 확장 가능한 모델을 만들기 위해.

제안 방법

  • 국가-년도 단위에서 국내총생산, 인당 국내총생산, 그리고 인구에 대한 잠재적 값들을 동시에 추정하는 3차원 잠재적 특성 모델을 수립하기 위해.
  • 각 잠재적 개념에 대한 관측 데이터를 여러 소스에서 취득하여 측정 오차와 불확실성 모델링이 가능하도록 하기 위해.
  • 각 국가-년도 추정치에 대한 사후 분포와 예측 구간을 추정하기 위해 베이지안 계층 모델링을 적용하기 위해.
  • 시간적 및 공간적 종속성을 반영하는 동적 모델링 구성 요소를 통합하여 추세와 국가 간 상관관계를 반영하기 위해.
  • 기록된 역사적 자료와 현대 데이터를 사용하여 모델을 校정하고, 마르코프 체인 몬테카를로(MCMC) 또는 유사한 계산 방법을 통해 모수 추정을 수행하기 위해.
  • 공개된 데이터와 코드를 Dataverse 레포지터리에 게시함으로써 모델의 투명성과 재현 가능성을 확보하기 위해.

실험 결과

연구 질문

  • RQ1다양한 역사적 및 현대 데이터 소스를 통합함으로써 국내총생산, 인당 국내총생산, 그리고 인구 추정치의 정확도를 어떻게 향상시킬 수 있는가?
  • RQ2기존의 경제적 및 인구통계적 지표가 체계적인 오차나 과도한 단순화로 인해 얼마나 심각하게 영향을 받는가?
  • RQ3다양한 시기와 지역에서 국가-년도 추정치의 상대적 정밀도는 어느 정도이며, 이를 어떻게 정량화할 수 있는가?
  • RQ4일관된 잠재적 개념의 여러 지표를 효과적으로 표현하면서 측정 오차를 고려하는 통합 잠재변수 모델이 가능한가?
  • RQ5새로운 데이터 소스가 등장하거나 검증될 경우 모델은 어떻게 확장하거나 개선할 수 있는가?

주요 결과

  • 모델은 국내총생산, 인당 국내총생산, 그리고 인구의 국가-년도 추정치를 기원전 1500년까지 확장하여, 기존 데이터셋에 비해 시간적 커버리지가 크게 넓어졌다.
  • 각 국가-년도 추정치에 대해 사후 예측 구간이 생성되어 추정 불확실성에 대한 원칙적인 측정치를 제공한다.
  • 모델은 다양한 데이터 소스가 정밀도에 다르게 기여함을 보여주었으며, 일부 지역과 시기에서는 데이터가 부족하거나 일관되지 않아 불확실성이 더 높은 것으로 나타났다.
  • 여러 지표를 통합함으로써 단일 소스 추정치에 대한 의존도를 줄이고, 핵심 경제적 및 인구통계적 개념의 구성 타당성을 향상시켰다.
  • 이 프레임워크는 데이터 품질과 모델 적합도의 체계적 평가를 가능하게 하여, 연구자들이 시간과 공간에 따라 추정치의 신뢰도를 평가할 수 있도록 했다.
  • 모든 데이터와 코드는 Dataverse 레포지터리에 공개되어 재현 가능성을 높이고 향후 모델 확장에 기여한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.