Skip to main content
QUICK REVIEW

[论文解读] Analyzing interferometric observations of strong gravitational lenses with recurrent and convolutional neural networks

Warren R. Morningstar, Yashar Hezaveh|arXiv (Cornell University)|Jul 31, 2018
Adaptive optics and wavefront sensing参考文献 3被引用 24
一句话总结

该论文提出了一种深度学习框架,结合循环神经网络(RIM)进行图像反卷积,以及卷积神经网络(CNN)进行透镜参数估计,在ALMA干涉测量数据上实现了比传统最大似然方法快六数量级以上的高精度推理,不确定性控制在最优方法的两倍以内。

ABSTRACT

We use convolutional neural networks (CNNs) and recurrent neural networks (RNNs) to estimate the parameters of strong gravitational lenses from interferometric observations. We explore multiple strategies and find that the best results are obtained when the effects of the dirty beam are first removed from the images with a deconvolution performed with an RNN-based structure before estimating the parameters. For this purpose, we use the recurrent inference machine (RIM) introduced in Putzky & Welling (2017). This provides a fast and automated alternative to the traditional CLEAN algorithm. We obtain the uncertainties of the estimated parameters using variational inference with Bernoulli distributions. We test the performance of the networks with a simulated test dataset as well as with five ALMA observations of strong lenses. For the observed ALMA data we compare our estimates with values obtained from a maximum-likelihood lens modeling method which operates in the visibility space and find consistent results. We show that we can estimate the lensing parameters with high accuracy using a combination of an RNN structure performing image deconvolution and a CNN performing lensing analysis, with uncertainties less than a factor of two higher than those achieved with maximum-likelihood methods. Including the deconvolution procedure performed by RIM, a single evaluation can be done in about a second on a single GPU, providing a more than six orders of magnitude increase in analysis speed while using about eight orders of magnitude less computational resources compared to maximum-likelihood lens modeling in the uv-plane. We conclude that this is a promising method for the analysis of mm and cm interferometric data from current facilities (e.g., ALMA, JVLA) and future large interferometric observatories (e.g., SKA), where an analysis in the uv-plane could be difficult or unfeasible.

研究动机与目标

  • 开发一种快速、自动化的传统uv空间最大似然透镜建模在干涉测量数据上的替代方法。
  • 利用深度学习提升强引力透镜分析中的参数估计精度与不确定性校准。
  • 降低ALMA及未来SKA等望远镜大规模干涉测量数据集分析的计算成本与时间。
  • 通过在具有真实统计特性的模拟数据上训练,实现对真实ALMA观测的稳健推理。
  • 通过变分推断与伯努利分布集成不确定性量化,捕捉反卷积过程带来的系统性效应。

提出的方法

  • 直接在从uv数据重建的脏图像上训练前馈CNN,以估计透镜参数。
  • 在CNN推理前,使用基于可微分RNN架构的循环推理机(RIM),对脏束效应进行反卷积。
  • 采用变分推断与伯努利分布估计参数不确定性,包括反卷积过程带来的系统性贡献。
  • 通过模拟uv覆盖网格与可见度预测生成训练数据,近似真实观测条件。
  • 在模拟透镜系统上进行端到端训练,并在SPT源的真实ALMA观测上进行验证。
  • 在单张GPU上实现每源约1秒的推理速度,具备极强的可扩展性。

实验结果

研究问题

  • RQ1结合基于RNN的反卷积与基于CNN的分析的混合深度学习模型,能否在干涉测量数据上实现高精度的透镜参数估计?
  • RQ2该方法在精度、不确定性校准与计算成本方面,与传统最大似然建模相比表现如何?
  • RQ3基于RIM的反卷积方法能否在保真度与不确定性追踪方面优于经典算法CLEAN?
  • RQ4在具有复杂统计特性的真实ALMA观测中,基于模拟数据训练的网络在多大程度上具备泛化能力?
  • RQ5神经网络方法的不确定性估计能否保持适当的覆盖概率,包括系统性效应?

主要发现

  • 该方法的中位数参数估计精度在最大似然建模的两倍以内,表现出高精度。
  • 推理时间缩短至单张GPU上每源约1秒,相比传统uv空间建模方法提速超过六个数量级。
  • 与最大似然方法相比,计算资源使用量降低了约八个数量级。
  • 基于RIM的反卷积生成的图像保真度高于CLEAN,且支持系统性不确定性追踪,提升了鲁棒性。
  • 在真实ALMA数据上,神经网络方法的参数估计结果与可见度空间中的最大似然建模结果一致。
  • 不确定性覆盖概率校准良好,表明该方法能正确捕捉反卷积过程中引入的系统性误差。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。