QUICK REVIEW

[論文レビュー] Latent Estimation of GDP, GDP per capita, and Population from Historic and Contemporary Sources

Christopher J. Fariss, Charles Crabtree|arXiv (Cornell University)|Jun 4, 2017

Economic and Technological Innovation被引用数 33

ひとこと要約

本論文は、1500年から2015年までの国年単位でGDP、一人当たりGDP、人口を推定するために、歴史的および現代的データソースを統合する動的で三次元の潜在的特徴モデルを紹介する。複数の指標を活用し、事後予測区間を生成することで、測定の正確性を向上させ、推定の不確実性を定量化し、社会科学研究のための原則的で拡張可能なフレームワークを提供する。

ABSTRACT

The concepts of Gross Domestic Product (GDP), GDP per capita, and population are central to the study of political science and economics. However, a growing literature suggests that existing measures of these concepts contain considerable error or are based on overly simplistic modeling choices. We address these problems by creating a dynamic, three-dimensional latent trait model, which uses observed information about GDP, GDP per capita, and population to estimate posterior prediction intervals for each of these important concepts. By combining historical and contemporary sources of information, we are able to extend the temporal and spatial coverage of existing datasets for country-year units back to 1500 A.D through 2015 A.D. and, because the model makes use of multiple indicators of the underlying concepts, we are able to estimate the relative precision of the different country-year estimates. Overall, our latent variable model offers a principled method for incorporating information from different historic and contemporary data sources. It can be expanded or refined as researchers discover new or alternative sources of information about these concepts.

研究の動機と目的

GDP、一人当たりGDP、人口の既存の測定値に、単純化されたモデルやデータ制限による顕著な誤差が存在するという懸念が高まっていることに応える。
多様な歴史的および現代的データソースを統合することで、国年単位の推定を西暦1500年まで拡張する。
測定誤差と経済的・人口統計的指標の不確実性を考慮する、原則的で統合可能な統計フレームワークを開発する。
同じ潜在的概念の複数の指標をモデル化することで、各国年単位の推定の相対的精度を評価する。
新しいデータソースが入手可能になったり、確認されたりするたびに、モデルを更新または拡張できる柔軟で拡張可能なモデルを構築する。

提案手法

国年単位でGDP、一人当たりGDP、人口の潜在的値を同時に推定する三次元の潜在的特徴モデルを構築する。
各潜在的概念の指標として、複数のソースからの観測データを用い、測定誤差と不確実性のモデル化を可能にする。
ベイズ階層モデルを適用し、各国年単位の推定における事後分布および予測区間を推定する。
時間的および空間的依存性を、動的モデリング要素を通じて反映させ、傾向と国間相関を捉える。
歴史的記録と現代データを用いてモデルをキャリブレーションし、パラメータ推定にはマルコフ連鎖モンテカルロ法（MCMC）または類似の計算手法を用いる。
公開された論文に伴い、すべてのデータとコードをDataverseリポジトリに共有することで、モデルの透明性と再現可能性を確保する。

実験結果

リサーチクエスチョン

RQ1多様な歴史的および現代的データソースを統合することで、GDP、一人当たりGDP、人口の推定の正確性をどのように向上させられるか。
RQ2既存の経済的および人口統計的指標の測定値は、どの程度体系的な誤差や単純化の影響を受けており、その影響は何か。
RQ3異なる時間帯や地域における国年単位の推定の相対的精度はどの程度で、どのようにして定量化できるか。
RQ4統一された潜在変数モデルは、同じ潜在的概念の複数の指標を測定誤差を考慮しながら効果的に表現できるか。
RQ5新しいデータソースが出現したり、検証されたりする際、モデルはどのように拡張または改善できるか。

主な発見

本モデルは、GDP、一人当たりGDP、人口の国年単位の推定を西暦1500年まで拡張し、既存のデータセットと比較して著しく時間的カバレッジを拡大した。
各国年単位の推定に対して、事後予測区間が生成され、推定の不確実性を原則的かつ体系的に測定できる。
モデルは、異なるデータソースが精度に異なる寄与をしていることを示し、一部の地域や時期では、データが希薄または一貫性がないため不確実性が高まっていることを明らかにした。
複数の指標を統合することで、単一のソースに依存するのを減らし、主要な経済的および人口統計的概念の妥当性を高めた。
フレームワークにより、データ品質とモデル適合度の系統的評価が可能となり、研究者が推定の信頼性を時間的および空間的に評価できるようになった。
すべてのデータとコードは、Dataverseリポジトリを通じて公開されており、再現性と将来的なモデル拡張を支援している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。