Skip to main content
QUICK REVIEW

[논문 리뷰] A Cross-Domain Graph Learning Protocol for Single-Step Molecular Geometry Refinement

Chengchun Liu, Wendi Cai|arXiv (Cornell University)|2026. 01. 30.
Machine Learning in Materials Science인용 수 0
한 줄 요약

GeoOpt-Net은 저비용의 초기 콘포머에서 단일 순전파로 DFT-품질 기하를 산출하는 다지배 SE(3)-등가 기하 정제 네트워크로, 두 단계의 다중 충실도 학습 및 FAFM 보정을 활용합니다.

ABSTRACT

Accurate molecular geometries are a prerequisite for reliable quantum-chemical predictions, yet density functional theory (DFT) optimization remains a major bottleneck for high-throughput molecular screening. Here we present GeoOpt-Net, a multi-branch SE(3)-equivariant geometry refinement network that predicts DFT-quality structures at the B3LYP/TZVP level of theory in a single forward pass starting from inexpensive initial conformers generated at a low-cost force-field level. GeoOpt-Net is trained using a two-stage strategy in which a broadly pretrained geometric representation is subsequently fine-tuned to approach B3LYP/TZVP-level accuracy, with theory- and basis-set-aware calibration enabled by a fidelity-aware feature modulation (FAFM) mechanism. Benchmarking against representative approaches spanning classical conformer generation (RDKit), semiempirical quantum methods (xTB), data-driven geometry refinement pipelines (Auto3D), and machine-learning interatomic potentials (UMA) on external drug-like molecules demonstrates that GeoOpt-Net achieves sub-milli-Å all-atom RMSD with near-zero B3LYP/TZVP single-point energy deviations, indicating DFT-ready geometries that closely reproduce both structural and energetic references. Beyond geometric metrics, GeoOpt-Net generates initial guesses intrinsically compatible with DFT convergence criteria, yielding nonzero ``All-YES'' convergence rates (65.0\% under loose and 33.4\% under default thresholds), and substantially reducing re-optimization steps and wall-clock time. GeoOpt-Net further exhibits smooth and predictable energy scaling with molecular complexity while preserving key electronic observables such as dipole moments. Collectively, these results establish GeoOpt-Net as a scalable, physically consistent geometry refinement framework that enables efficient acceleration of DFT-based quantum-chemical workflows.

연구 동기 및 목표

  • 저비용의 초기 콘포머를 하나의 순전파로 고정밀 DFT 기하(B3LYP/TZVP)로 연결합니다.
  • 결합 길이, 각도, 이위도를 분리해 견고한 정제를 위한 다분기 SE(3)-등가 아키텍처를 개발합니다.
  • 충실도 인지 특징 변조(FAFM)를 포함한 이중 단계의 다충실도 학습 전략을 활용해 이론 수준 전반에 걸쳐 기하를 보정합니다.
  • 대규모 약물유사 분자에 대해 향상된 DFT 수렴 확률과 벽시계 시간의 감소를 보여줍니다.

제안 방법

  • 쌍대 거리, 각도, 이위도를 불변 피처와 방향 피처로 인코딩하는 세 스트림 SE(3)-등가 그래프를 사용합니다.
  • Transformer로 디코딩하여 단일 패스로 SE(3)-등가 좌표 업데이트를 생성합니다.
  • 두 단계로 학습합니다: B3LYP/6-31G(2df,p)에서 사전 학습하고 B3LYP/TZVP에서 FAFM으로 보정 학습합니다.
  • 전역 카치시안 RMSD와 결합 길이/각도/이위도 오차 및 결합 범위 제약을 결합한 복합 손실을 사용합니다.
  • 회전-후 예측(rot-then-predict) 대 예측-후 회전(predict-then-rotate) 테스트로 등가성을 검증하고 수치 정밀도가 1e-5 Å 이내임을 확인합니다.

실험 결과

연구 질문

  • RQ1단일 패스의 SE(3)-등가 모델이 임의의 초기 콘포머를 B3LYP/TZVP 품질의 기하로 정제할 수 있는가?
  • RQ2FAFM이 포함된 이중 단계의 다충실도 학습이 서로 다른 전자구조 수준 간의 이전 가능한 이론 인지 보정이 가능하게 하는가?
  • RQ3기하 정제가 대규모 약물유사 분자의 향상된 DFT 수렴 속도와 전자적 관찰치의 보존으로 이어지는가?
  • RQ4GeoOpt-Net은 기하 및 에너지 정합성 측면에서 포스필드, 준경험적 및 다른 ML 정제 기법과 어떻게 비교되는가?
  • RQ5모 method가 학습 분포를 넘는 분자 크기와 복잡성에 대해 강건한가?

주요 결과

지표Ref (DFT)GeoOpt-NetUMAxTBAuto3DRDKit
기하의 RMSD (Å)0.00010.0001? (GeoOpt-Net)0.57181.15290.9740.983
ΔE (kcal/mol)0.0020.0020.6255.8942.4612.466
RMSD (Å)0.00020.0002? (GeoOpt-Net)1.03370.82211.0411.055
ΔE (kcal/mol)0.0030.0033.0552.8803.1623.180
RMSD (Å)0.00160.0016? (GeoOpt-Net)1.07741.27561.3851.388
ΔE (kcal/mol)0.0450.0454.1086.0146.1146.115
  • GeoOpt-Net은 B3LYP/TZVP 참고값에 대해 모든 원자 RMSD가 밀리옹 이하를 달성한다.
  • 단일 패스 정제는 B3LYP/TZVP에서 ΔE 편차가 거의 0에 근접하게 만들어 기하가 정확함을 시사한다.
  • GeoOpt-Net으로 얻은 초기 기하는 baselines(0%)보다 높은 ALL-YES DFT 수렴 비율을 보인다(느슨한 65.0%, 기본 33.4%).
  • GeoOpt-Net은 DFT 재최적화에 필요한 최적화 단계 수와 벽시계 시간을 크게 줄이는 모습을 보인다.
  • 이위도(비터) 오차가 1–2개의 차원에서 감소하여 구성 대비 정확도가 크게 향상된다.
  • GeoOpt-Net 기하에서 계산된 쌍극 모멘트는 DFT 참조값과 0.002 Debye 이내로 일치하여 baselines의 편차(-0.369~ -0.498 Debye)을 능가한다.
  • 에너지 편차 ΔE는 대부분의 분자에서 0.1 kcal/mol 이하로 증가하는 분자 복잡도에서도 매끄럽게 확대된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.