Skip to main content
QUICK REVIEW

[論文レビュー] From Dark Matter to Galaxies with Convolutional Networks

Xinyue Zhang, Yanfang Wang|arXiv (Cornell University)|Feb 15, 2019
Galaxies: Formation, Evolution, Phenomena参考文献 29被引用数 40
ひとこと要約

本論文は、3Dダークマター場をN-体シミュレーションから3D銀河分布へ写像する2段階の畳み込みニューラルネットワークを訓練し、従来のHOD手法と同等またはそれを上回る複数の統計量を達成し、訓練/生成速度にも有利である。

ABSTRACT

Cosmological surveys aim at answering fundamental questions about our Universe, including the nature of dark matter or the reason of unexpected accelerated expansion of the Universe. In order to answer these questions, two important ingredients are needed: 1) data from observations and 2) a theoretical model that allows fast comparison between observation and theory. Most of the cosmological surveys observe galaxies, which are very difficult to model theoretically due to the complicated physics involved in their formation and evolution; modeling realistic galaxies over cosmological volumes requires running computationally expensive hydrodynamic simulations that can cost millions of CPU hours. In this paper, we propose to use deep learning to establish a mapping between the 3D galaxy distribution in hydrodynamic simulations and its underlying dark matter distribution. One of the major challenges in this pursuit is the very high sparsity in the predicted galaxy distribution. To this end, we develop a two-phase convolutional neural network architecture to generate fast galaxy catalogues, and compare our results against a standard cosmological technique. We find that our proposed approach either outperforms or is competitive with traditional cosmological techniques. Compared to the common methods used in cosmology, our approach also provides a nice trade-off between time-consumption (comparable to fastest benchmark in the literature) and the quality and accuracy of the predicted simulation. In combination with current and upcoming data from cosmological observations, our method has the potential to answer fundamental questions about our Universe with the highest accuracy.

研究の動機と目的

  • ダークマター分布から観測と効率的に比較できる高速で正確な銀河カタログ生成を動機づける。
  • 密なダークマター場から非常にまばらな3D銀河場を予測する課題に対処する。
  • 標準的手法より予測精度を向上させる2段階CNNアーキテクチャを開発・評価する。
  • 複数の宇宙論統計量(パワースペクトル、ビスパクトラム、ボイド)にわたってモデルを評価し、HODと比較する。

提案手法

  • 3Dダークマター密度から3D銀河数への監督付き学習タスクとしてCNNを用いて銀河予測を定式化する。
  • 第一段階はボクセルごとの銀河の有無を予測する2値分類器で、重み付きクロスエントロピーを用いる。第二段階は銀河を含むと予測されたボクセルに対して銀河数を予測するリグレサーで、L2損失を用いる。
  • 過度な高解像度入力への依存を減らすため、U-Net、Recurrent Residual U-Net、Inception などの複数の3D CNNバリアントを、修正されたスキップ接続戦略とともに試す。
  • シミュレーションボリュームを 32^3 のサブキューブ(各々2.3 Mpc/h)に格子化し、1024^3 ボクセル密度場を用いてトレインを62.6%、バリデーション19.63%、テスト17.76%で実施。
  • Halo Occupation Distribution(HOD)を3パラメータ(M_min, M1, α)でベンチマークし、銀河密度とパワースペクトルを一致させるように最適化。
  • パワースペクトル、転送関数、ビスパクトラム、ボイド、および Visualization を用いてスケール依存の精度を評価する。

実験結果

リサーチクエスチョン

  • RQ1CNNベースのモデルは、複数のスケールにわたって従来のHODアプローチよりダークマター密度場から銀河分布への写像を学習できるか。
  • RQ22段階の訓練方式は、ボクセルにおける銀河のまばらさによる極端なクラス不均衡を緩和できるか。
  • RQ3この写像のために、どのCNNアーキテクチャと設定が多段階の空間情報を最も効果的に捉えるか。
  • RQ4HODと比較して、ビスパーカルトラムやボイド豊度などの高次の統計量でMLベースの手法はどうなるか。

主な発見

  • Two-phase Inception+R2Unet モデルは、大規模スケールでHODとほぼ同等またはそれを上回り、小規模スケールではパワースペクトルで優位に上回る。
  • 二段階アプローチは、ボクセル数の予測誤差を低減し、MSEが約0.00308、HODが約0.01007と比較して低い。
  • Binary-phase の結果は、第一段階の Inception が最も高いリコール(95.72%)を達成し、銀河を含むボクセルの識別が効果的であることを示す。
  • Inception+R2Unet のビスパクトラム残差は、2つの tested scales(k1=0.5, k2=0.6 h/Mpc)でターゲットに対して2.7%と5.0%である。小さなスケールでは、モデルはHODに比べて大幅に優れており(k1=1.2, k2=1.3 h/Mpc で相対残差0.68%対1193%)。
  • ボイド豊度(ボイドサイズ関数)は、Inception+R2Unet および HOD の両方でターゲットと一致しており、大規模構造統計量での競争力のある性能を示す。
  • 訓練/生成速度:Illustris 全体の流体力学シミュレーションは約1900万CPU時間、HODは約8 CPU時間、Inception+R2Unetは訓練とシミュレーション生成で約3 GPU時間。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。