Skip to main content
QUICK REVIEW

[论文解读] Identifications of RR Lyrae stars and Quasars from the simulated data of Mephisto-W Survey

Lei Lei, Bingqiu Chen|arXiv (Cornell University)|Nov 16, 2021
Stellar, planetary, and galactic studies参考文献 34被引用 8
一句话总结

本研究提出了一种随机森林分类器(RFC)框架,用于从Mephisto-W巡天的模拟多波段(uvgriz)光变曲线中识别RR型变星和类星体。基于SDSS条带82的光变曲线和模拟的观测历元,该方法对RR型变星实现了95.4%的纯度和96.9%的完整性,对类星体实现了91.4%的纯度和90.2%的完整性,表明其在数据需求极少的情况下仍具有高精度。

ABSTRACT

We have investigated the feasibilities and accuracies of the identifications of RR Lyrae stars and quasars from the simulated data of the Multi-channel Photometric Survey Telescope (Mephisto) W Survey. Based on the variable sources light curve libraries from the Sloan Digital Sky Survey (SDSS) Stripe 82 data and the observation history simulation from the Mephisto-W Survey Scheduler, we have simulated the $uvgriz$ multi-band light curves of RR Lyrae stars, quasars and other variable sources for the first year observation of Mephisto-W Survey. We have applied the ensemble machine learning algorithm Random Forest Classifier (RFC) to identify RR Lyrae stars and quasars, respectively. We build training and test samples and extract ~ 150 features from the simulated light curves and train two RFCs respectively for the RR Lyrae star and quasar classification. We find that, our RFCs are able to select the RR Lyrae stars and quasars with remarkably high precision and completeness, with $purity$ = 95.4 per cent and $completeness$ = 96.9 per cent for the RR Lyrae RFC and $purity$ = 91.4 per cent and $completeness$ = 90.2 per cent for the quasar RFC. We have also derived relative importances of the extracted features utilized to classify RR Lyrae stars and quasars.

研究动机与目标

  • 评估在Mephisto-W巡天第一年数据中识别RR型变星和类星体的可行性和准确性。
  • 开发一种稳健的机器学习流程,用于从稀疏、多波段测光光变曲线中分类变星和类星体。
  • 实现在观测次数有限的时域巡天中高效、大规模的源识别。
  • 支持Mephisto-W巡天的关键科学目标,包括银河系考古学和宇宙学研究。

提出的方法

  • 使用SDSS条带82的光变曲线和Mephisto-W巡天调度器的观测历元模型,模拟RR型变星、类星体及其他变星的uvgriz多波段光变曲线。
  • 利用与SMSS DR2交叉匹配获得的线性校准关系,将SDSS的ugriz星等转换为SkyMapper风格的uvgriz星等。
  • 基于已知周期和相位,应用相位折叠和线性插值,模拟RR型变星的周期性光变曲线。
  • 对于非周期性类星体,从一年内随机选取五次SDSS观测,并重新校准至2022年日历日期,以模拟真实的观测历元。
  • 根据观测条件注入真实的高斯测光噪声,生成“观测到”的光变曲线。
  • 使用483颗RR型变星和9,107颗类星体作为正样本,等量负样本,基于150多个提取特征训练独立的随机森林分类器(RFCs)。

实验结果

研究问题

  • RQ1机器学习能否有效从Mephisto-W巡天的稀疏多波段光变曲线中识别RR型变星?
  • RQ2在模拟的Mephisto-W数据中,RFC对类星体的分类准确率和完整性如何?
  • RQ3RR型变星与类星体分类的特征重要性排序有何差异?
  • RQ4RFC方法在训练数据存在标签噪声时的鲁棒性如何?
  • RQ5该方法能否高效应用于观测历元有限的大规模时域巡天?

主要发现

  • RR型变星RFC实现了95.4%的纯度和96.9%的完整性,表明识别具有高精度和高效率。
  • 类星体RFC实现了91.4%的纯度和90.2%的完整性,显示出在类星体分类任务中的强劲表现。
  • RFC方法对标签噪声具有鲁棒性,在5%标签噪声下,RR型变星和类星体分类器的错误率仅分别增加0.04%和0.4%。
  • 对RR型变星分类最重要的特征是g−r和mrcolor,而对类星体识别最具影响力的特征是u−g和g−r。
  • 该方法仅需每一年每个天区四到五次观测,因此高效且适用于观测时间有限的广域巡天。
  • 该框架可迁移至其他时域巡天(如ZTF、WFST、LSST和CSST),实现可扩展的源分类。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。