Skip to main content
QUICK REVIEW

[論文レビュー] Uncertainty-aware and Data-efficient Cosmological Emulation using Gaussian Processes and PCA

Sven Günther|arXiv (Cornell University)|Jul 3, 2023
Gaussian Processes and Bayesian Inference被引用数 11
ひとこと要約

本論文は、オンラインアクティブ学習を用いてGaussian ProcessesとPCAを組み合わせた不確実性を考慮したエミュレータを導入し、ベイズ宇宙論推論を加速させ、理論計算呼び出し回数と計算コストを大幅に削減しつつ、事後分布の精度を維持する。

ABSTRACT

Bayesian parameter inference is one of the key elements for model selection in cosmological research. However, the available inference tools require a large number of calls to simulation codes which can lead to high and sometimes even infeasible computational costs. In this work we propose a new way of emulating simulation codes for Bayesian parameter inference. In particular, this novel approach emphasizes the uncertainty-awareness of the emulator, which allows to state the emulation accuracy and ensures reliable performance. With a focus on data efficiency, we implement an active learning algorithm based on a combination of Gaussian Processes and Principal Component Analysis. We find that for an MCMC analysis of Planck and BAO data on the $Λ$CDM model (6 model and 21 nuisance parameters) we can reduce the number of simulation calls by a factor of $\sim$500 and save about $96\%$ of the computational costs.

研究の動機と目的

  • 高コストなEinstein-Boltzmann解算機のため、宇宙論パラメータ推論をより高速化する必要性を動機づける。
  • Gaussian ProcessesとPCAを組み合わせたデータ圧縮を行う不確実性を考慮したエミュレータを提案する。
  • 推論中にエミュレータを訓練するオンラインアクティブラーニング戦略を実装する。
  • Planck+BAOの LambdaCDM テストケースで顕著な高速化と制御されたバイアスを示す。

提案手法

  • 異方性RBFカーネルを用いて低次元量をエミュレートし、高次元の観測量(例:CMBスペクトル)の圧縮に主成分分析(PCA)を用いる。
  • 高次元データをPCA空間へ変換し、各成分を独立かつ高速にGPでエミュレーションできるようにする。
  • PCA情報損失とGPサンプリングのまばらさからエミュレータの不確実性を定量化し、それをデータ空間へ伝搬させる。
  • 尤度に基づく不確実性基準で新しい理論評価を生成する時期を決定し、エミュレータを再訓練するオンラインアクティブラーニングを採用する。
  • 変更されたcobayaベイズサンプラーへエミュレータを統合し、理論評価を削減した状態でMCMCを実行する。
Figure 1: Uncertainty qualification of the CMB TT spectrum emulator for a training scenario similar to the one outlined in section III . We compare the performance of the emulator with the full calculation obtained by CLASS . (Top) $D_{\ell}$ spectrum. (Center) Residuals with the uncertainty estimat
Figure 1: Uncertainty qualification of the CMB TT spectrum emulator for a training scenario similar to the one outlined in section III . We compare the performance of the emulator with the full calculation obtained by CLASS . (Top) $D_{\ell}$ spectrum. (Center) Residuals with the uncertainty estimat

実験結果

リサーチクエスチョン

  • RQ1GPベースのエミュレーションを宇宙論推論のためにどのように不確実性を考慮できるようにするか?
  • RQ2PCAは推論精度を損なうことなく宇宙論観測量の次元を削減できるか?
  • RQ3オンラインアクティブラーニングを用いたPlanck+BAO LambdaCDMで理論評価と計算コストのどの程度の高速化が達成できるか?
  • RQ4エミュレータ由来の不確実性は全計算を用いた計算と比較して後方分布推定へどのように伝搬するか?

主な発見

パラメータエミュレータの平均デフォルトの平均バイアス
h0.6804(45)0.6804(45)0.004
log(10^{10}A_{s})3.043(16)3.042(16)0.05
n_{s}0.9654(38)0.9653(38)0.03
Ω_{b}h^{2}0.02238(14)0.02238(14)0.01
Ω_{cdm}h^{2}0.1196(10)0.1196(10)-0.01
τ_{reio}0.0542(77)0.538(76)0.05
y_{cal}1.0006(25)1.0006(25)0.007
  • エミュレータはデータ効率性とともに顕著な高速化を達成し、予測の不確実性推定を提供する。
  • PlanckとBAOデータのLambdaCDMモデルで6つの宇宙論パラメータと21のノイズパラメータの場合、理論呼び出しは約500倍から126回へ削減され、計算コストの約96%を節約。
  • エミュレータを用いた場合、6つの宇宙論パラメータとPlanckの較正に対して事後平均とバイアスは小さく(≤5%)。
  • PCA情報損失とGPサンプリングのまばらさからの不確実性をデータ空間へ伝搬させ、総合的なエミュレータ不確実性を形成する。
  • このアプローチは少ない高価な理論評価で信頼性の高い推論を可能にし、全計算の事後分布と一致を維持する。
Figure 2: Predicted posterior estimate for the $\Lambda\mathrm{CDM}$ model tested on BAO and Planck TT,TE and EE data. (Blue) posterior estimate using the emulator. It was trained with 126 calls of the theory code. (Red) Comparative MCMC without the use of the emulator. The contours were generated w
Figure 2: Predicted posterior estimate for the $\Lambda\mathrm{CDM}$ model tested on BAO and Planck TT,TE and EE data. (Blue) posterior estimate using the emulator. It was trained with 126 calls of the theory code. (Red) Comparative MCMC without the use of the emulator. The contours were generated w

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。