Skip to main content
QUICK REVIEW

[論文レビュー] Data-efficient surrogate modeling of spectral functions using Gaussian processes: An application to the $t$-$t'$-$t''$-$J$ model

Sanket Jantre, Nathan M. Urban|arXiv (Cornell University)|Mar 13, 2026
Machine Learning in Materials Science被引用数 0
ひとこと要約

データ効率的な前方代理モデルでスペクトル関数を扱う。DKL-SVGPは限定データでFFNN全データ性能に迫る。

ABSTRACT

Spectral functions encode key many-body information but are costly to compute with high fidelity. Machine-learning surrogates have emerged as a powerful alternative, yet many approaches require large training datasets. We develop a data-efficient surrogate for spectral functions using the $t$-$t'$-$t''$-$J$ model, which describes the motion of a hole in a quantum antiferromagnet. Using $\sim$ 10$^5$ self-consistent Born approximation-based spectra from Lee, Carbone and Yin (Phys. Rev. B 107, 205132 (2023)), we train a deep-kernel Gaussian process surrogate model with sparse variational inference (DKL-SVGP) using only 10% of the available training spectra. We benchmark against feed-forward neural networks (FFNN) trained on the same reduced subset and on the full dataset. The proposed DKL-SVGP model consistently outperforms the reduced-data FFNN and, despite using only 10% of the training spectra, achieves spectrum-wise errors within the same order-of-magnitude as the full-data FFNN baseline. Worst-tail diagnostics show improved fidelity on difficult spectra, while peak-level analysis indicates that DKL-SVGP recovers dominant peak heights with comparable accuracy and improves peak-location agreement under a matched-peak evaluation that mitigates rare peak-swapping cases. Overall, these results highlight GP-based surrogates as a competitive and data-efficient approach for spectral-function prediction in scarce-data regimes.

研究の動機と目的

  • scarce training dataでも良好に機能するスペクトル関数の代理モデルを動機づける。
  • ハミルトニアンパラメータと状態密度A(ω)を結ぶデータ効率的な前方モデルを開発する。
  • 深層カーネルSVGP代理モデルがデータ削減ニューラルベースラインを上回ることを示す。
  • 最悪尾部を含むスペクトラムレベルおよびピークレベルの忠実性を評価し、最悪尾部診断と一致したピーク評価を含む。
  • スペクトル問題におけるアクティブラーニングと逆推定の含意を強調する。

提案手法

  • A(ω)をハミルトニアンパラメータx=(t′, t′′, J)とエネルギーωの関数とみなし、固定ωグリッド上のスペクトルで訓練する。
  • 件の誘導点M=1536を用いた sparse variational Gaussian process (SVGP) 代理として深層カーネル学習(DKL)を適用する。
  • パラメータネットワークhxとフーリエωトランクを組み合わせた軽量特徴ネットワークφθを用い、柔軟なカーネルを持つGPへ入力。
  • 共同入力zjoint=[φθ(s), ω̃]を、学習空間でのMatérn-3/2カーネルとωのスペクトル混合カーネルを組み合わせた混合カーネルk(s,z′)で結合する。
  • 前処理: xを標準化、ωを再スケーリング、A(ω)を対数標準化し、LCYデータセットの10%で訓練し、予測平均を代理出力として評価する。
  • 同じ10%サブセットおよび全データで訓練したFFNNベースラインと比較する;補足としてKRRおよびkNNベースラインを付録に含める。
Figure 1: Illustration of our deep kernel Gaussian process surrogate model trained with stochastic variational inference and applied to the forward problem of predicting a DOS given Hamiltonian parameters $x=(t^{\prime},t^{\prime\prime},J)$ and energy-grid points $\omega$ . We first standardize $x\t
Figure 1: Illustration of our deep kernel Gaussian process surrogate model trained with stochastic variational inference and applied to the forward problem of predicting a DOS given Hamiltonian parameters $x=(t^{\prime},t^{\prime\prime},J)$ and energy-grid points $\omega$ . We first standardize $x\t

実験結果

リサーチクエスチョン

  • RQ1 GPベースの深層カーネル学習による代理が、訓練データのわずか10%でA(ω)の競争力ある精度を達成できるか。
  • RQ2 DKL-SVGPはスペクトラム単位およびピーク単位の忠実度において、データ削減FFNNと全データFFNNとどう比較されるか。
  • RQ3 最悪尾部の難しいスペクトルで代理が忠実性を維持し、マッチドピーク評価の下でピーク高さと位置をより適切に回復できるか。

主な発見

Data SplitFFNN (full)DKL-SVGPFFNN Subset
Train1.793 (1.528)4.581 (3.327)7.800 (6.129)
Validation1.933 (1.595)4.612 (3.366)7.881 (6.242)
Test1.928 (1.588)4.544 (3.307)7.831 (6.119)
  • DKD-SVGPは全データのFFNNと比較して同じサブセットで訓練した場合の平均行RMSEを約42%低減。
  • テストにおけるFFNN(全データ)対DKL-SVGPの平均行RMSEは1.93e-3対4.54e-3(DKL-SVGPは全データFFNNの約2.4倍程度)、全データには及ばないが近い。
  • テストの正規化RMSE(NRMSE): FFNN(全データ)1.365e-2;DKL-SVGP(サブセット)3.369e-2、データ効率の向上を示唆。
  • 最悪尾部の診断では、難しいスペクトルに対してDKL-SVGPはデータ削減FFNNよりも支配的なスペクトル構造をよりよく保持。
  • マッチドピーク評価におけるピーク高さは概ね同等、ピーク位置はDKL-SVGPのほうがわずかに正確(RMSE0.021対FFNNサブセット0.028)。
  • 全体として、GPベースの代理モデルはデータが乏しい領域でスペクトルモデリングの精度を高データ予算で提供する。
Figure 2: Worst-tail diagnostic on the held-out test dataset. Test spectra are ranked from worst to best by a reference error score (here, the FFNN row-RMSE over test dataset), and representative spectra at percentiles $\{0,2,4,6,8,10\}\%$ within this worst tail are shown. Each panel overlays the gr
Figure 2: Worst-tail diagnostic on the held-out test dataset. Test spectra are ranked from worst to best by a reference error score (here, the FFNN row-RMSE over test dataset), and representative spectra at percentiles $\{0,2,4,6,8,10\}\%$ within this worst tail are shown. Each panel overlays the gr

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。