Skip to main content
QUICK REVIEW

[논문 리뷰] Using a Neural Network Classifier to Select Galaxies with the Most Accurate Photometric Redshifts

Adam Broussard, Eric Gawiser|arXiv (Cornell University)|2021. 08. 30.
Galaxies: Formation, Evolution, Phenomena참고 문헌 74인용 수 3
한 줄 요약

이 논문은 LSST와 같은 대규모 설문 조사에서 가장 정확한 광학적 적색편이를 가진 은하를 선택하기 위해 맞춤형 신경망 분류기(NNC)를 제안한다. TPZ에 적합된 적색편이와 광학적 특징을 기반으로 훈련함으로써, NNC는 표준 광학적 적색편이 불확실성으로 가능한 것 이상으로 이방성 비율과 산란(σz)을 감소시킨다. 상위 1/3의 은하를 선택할 때, 이는 표준 TPZ 기반 선택 대비 이방성 비율이 35% 낮고 σz가 23% 낮아진다.

ABSTRACT

The Vera C. Rubin Observatory Legacy Survey of Space and Time (LSST) will produce several billion photometric redshifts (photo-$z$'s), enabling cosmological analyses to select a subset of galaxies with the most accurate photo-$z$. We perform initial redshift fits on Subaru Strategic Program galaxies with deep $grizy$ photometry using Trees for Photo-Z (TPZ) before applying a custom neural network classifier (NNC) tuned to select galaxies with $(z_\mathrm{phot} - z_\mathrm{spec})/(1+z_\mathrm{spec}) < 0.10$. We consider four cases of training and test sets ranging from an idealized case to using data augmentation to increase the representation of dim galaxies in the training set. Selections made using the NNC yield significant further improvements in outlier fraction and photo-$z$ scatter ($\sigma_z$) over those made with typical photo-$z$ uncertainties. As an example, when selecting the best third of the galaxy sample, the NNC achieves a 35% improvement in outlier rate and a 23% improvement in $\sigma_z$ compared to using uncertainties from TPZ. For cosmology and galaxy evolution studies, this method can be tuned to retain a particular sample size or to achieve a desired photo-$z$ accuracy; our results show that it is possible to retain more than a third of an LSST-like galaxy sample while reducing $\sigma_z$ by a factor of two compared to the full sample, with one-fifth as many photo-$z$ outliers. For surveys like LSST that are not limited by shot noise, this method enables a larger number of tomographic redshift bins and hence a significant increase in the total signal-to-noise of galaxy angular power spectra.

연구 동기 및 목표

  • 대규모 은하 설문 조사, 예를 들어 LSST와 같은 설문 조사에서 가장 신뢰할 수 있는 적색편이 추정치를 가진 은하를 선택하여 광학적 적색편이 정확도를 향상시키기.
  • 우주론적 군집 측정을 악화시키는 광학적 적색편이의 높은 이방성 비율과 산란 문제를 해결하기.
  • 기존의 광학적 적색편이 코드를 재훈련하거나 템플릿 선택 없이도 향상시킬 수 있는 후처리 방법을 개발하기.
  • 데이터 증강과 신경망 필터링이 원래 은하 샘플의 대부분을 유지하면서도 샘플 품질을 크게 향상시킬 수 있음을 보여주기.

제안 방법

  • TPZ에 적합된 적색편이와 광학적 특징을 입력으로 사용하여, (zphot − zspec)/(1 + zspec) < 0.10 조건을 만족하는 은하를 식별하기 위해 맞춤형 신경망 분류기(NNC)를 훈련한다.
  • NNC는 데이터 증강을 통해 어두운 은하의 표현을 향상시키기 위해 4가지 훈련/검증 세트 구성 방식으로 훈련된다.
  • 4층 피드포워드 신경망을 사용하며, 뉴런 수는 [100, 200, 100, 50]이며, 정확한 적색편이 선택을 위한 신뢰도 점수를 할당하기 위해 시그모이드 출력을 사용한다.
  • NNC는 TPZ 및 BPZ와 같은 기존 광학적 적색편이 코드에 후처리 도구로 적용되어 원래의 피팅 과정을 변경하지 않고도 선택을 정밀하게 조정한다.
  • TPZ 출력의 체계적 오차를 보정하기 위해 신경망 회귀기(NNR)를 테스트했지만, 이 연구에서는 유의미한 향상이 없었다.
  • 성능 평가에는 표본 비율(fsamp)이 1%에서 100%까지 다양하게 변할 때의 이방성 비율, NMAD, σz 등의 지표를 사용한다.

실험 결과

연구 질문

  • RQ1표준 불확실성 기반 컷을 사용하는 것 이상으로 신경망 분류기가 광학적 적색편이 추정치의 이방성 비율과 산란(σz)을 현저히 감소시킬 수 있는가?
  • RQ2특히 어두운 은하에 대해 데이터 증강이 NNC의 높은 정확도 광학적 적색편이 은하 선택 성능에 어떤 영향을 미치는가?
  • RQ3TPZ 및 BPZ와 같은 다양한 광학적 적색편이 코드에 NNC를 적용했을 때, 광학적 적색편이 정확도 향상 정도는 어느 정도인가?
  • RQ4TPZ 출력의 체계적 오차를 보정하기 위해 사전 분류용 신경망 회귀기(NNR)를 추가했을 때, 선택 성능 향상이 측정 가능한가?
  • RQ5이방성 거부 및 σz 감소 측면에서 최적의 선택 성능를 달성하기 위해 NNC의 훈련 샘플 크기는 어느 정도여야 하는가?

주요 결과

  • 상위 1/3의 은하를 선택할 때, NNC는 TPZ 불확실성 기반 선택 대비 이방성 비율을 35% 감소시키고 σz를 23% 감소시킨다.
  • 표본의 최상위 1/3을 선택할 때, NNC는 TPZ 보고서의 불확실성 기반 선택 대비 이방성 비율에서 35% 향상되고 σz에서 23% 향상된다.
  • Match → COSMOS2015 케이스에서 이방성 거부 성능을 최대화하기 위해 약 50,000개의 은하(훈련 세트의 30%)로 훈련하는 것이 충분하다.
  • 광학적 적색편이 오차의 NMAD는 훈련 샘플 크기가 증가함에 따라 단조롭고 점진적으로 향상되며, 더 큰 데이터셋으로부터도 계속해서 성능 향상이 기대된다.
  • BPZ에 적합된 적색편이에 NNC를 적용했을 때, TPZ 기반 선택과 유사한 이방성 및 σz 성능을 달성하지만, 약 0.008의 일정한 NMAD 오프셋이 존재한다.
  • TPZ의 체계적 오차를 보정하기 위해 NNR을 추가했지만, 유의미한 향상이 없었고, 따라서 최종 파ip라인에서 제외되었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.