Skip to main content
QUICK REVIEW

[논문 리뷰] Torsional Diffusion for Molecular Conformer Generation

Bowen Jing, Gabriele Corso|arXiv (Cornell University)|2022. 06. 01.
Mathematical Biology Tumor Growth인용 수 81
한 줄 요약

토션 각도(하이퍼토로스상)에서 작동하는 확산 모델로 분자 콘포머를 생성하며, GEOM-DRUGS에서 최첨단 결과를 달성하고 훨씬 적은 denoising 단계로 Boltzmann 샘플링을 위한 정확한 우도를 제공한다.

ABSTRACT

Molecular conformer generation is a fundamental task in computational chemistry. Several machine learning approaches have been developed, but none have outperformed state-of-the-art cheminformatics methods. We propose torsional diffusion, a novel diffusion framework that operates on the space of torsion angles via a diffusion process on the hypertorus and an extrinsic-to-intrinsic score model. On a standard benchmark of drug-like molecules, torsional diffusion generates superior conformer ensembles compared to machine learning and cheminformatics methods in terms of both RMSD and chemical properties, and is orders of magnitude faster than previous diffusion-based models. Moreover, our model provides exact likelihoods, which we employ to build the first generalizable Boltzmann generator. Code is available at https://github.com/gcorso/torsional-diffusion.

연구 동기 및 목표

  • 분자 유연성이 주로 놓여 있는 토션 자유도에서 확산을 집중시켜 효율적인 콘포머 생성의 필요성을 제시한다.
  • 3D 포인트 클라우드에서 작동하고 SE(3) 및 패리티 대칭을 존중하는 extrinsic-to-intrinsic 점수 모델을 개발한다.
  • 토션 각도에 대한 하이퍼토러스 상의 확산을 수식화하고 Boltzmann 스타일 학습을 위한 정확한 우도 계산을 가능하게 한다.
  • ML 및 화학정보학 기반 벤치마크를 능가하는 최첨단 콘포머 엔SEMBLE 품질과 화학적으로 관련된 특성을 시연한다.
  • 미확인 분자에 대해 일반화 가능한 샘플링을 위한 토션 볼츠만 생성기를 도입한다.

제안 방법

  • 토션 각도에 대한 확산을 하이퍼토러스 T^m 위의 확산 과정으로 수식화하고 래핑된 정규 섭동 커널을 사용한다.
  • 3D 콘포머(외적 좌표)를 입력으로 받아 토션 업데이트(내적 공간)를 출력하는 extrinsic-to-intrinsic 점수 모델을 SE(3)-불변성 및 패리티 동등성은 보존하는 방식으로 사용한다.
  • 회전 가능한 결합당 페소스칼라 출력과 최종 pseudotorque 층을 사용하여 토션 업데이트를 예측하고 SE(3) 불변성과 패리티 등가성을 보장한다.
  • 확률 흐름 ODE와 직접적인 발산항을 사용하여 토션 각도에 대한 정확한 로그 가능도(log-likelihood)를 계산하고 Boltzmann 분포를 이용한 에너지 기반 학습을 가능하게 한다.
  • 토션 가능도에서 유클리드 공간으로의 변환을 결정 인자 기반의 요인을 통해 제공하여 p_G(tau|L)와 p_G(x|L)을 연결하는 변환을 제공한다.
  • Boltzmann 샘플을 사용하여 denoising score-matching 손실에 가중치를 부여하는 에너지 기반 학습을 설명하고, 콘포머 생성을 위한 플로우로서 사용되는 점수 기반 모델로의 학습을 가능하게 한다.

실험 결과

연구 질문

  • RQ1토션 각도에서의 확산이 하이퍼토러스에서 전통적인 화학정보학 및 유클리드 확산 방법보다 우수한 콘포머 엔SEMBLE을 생성할 수 있는가?
  • RQ2외부에서 내부로의 SE(3)-불변 점수 모델이 일반화된 토션 정의 없이도 분자 의존적인 토션 업데이트를 견고하게 가능하게 하는가?
  • RQ3토션에 대한 정확한 우도를 계산하여 Boltzmann-생성기 스타일의 학습 및 미확인 분자에 대한 일반화 가능한 샘플링을 가능하게 할 수 있는가?
  • RQ4토션 확산 방법이 필요한 denoising 단계를 줄이면서 엔SEMBLE 품질과 화학적 특성을 향상시키는가?

주요 결과

  • GEOM-DRUGS에서 토션 확산은 baseline보다 커버리지(Cov) 높고 AMR 낮으며, RDKit ETKDG, OMEGA, GeoMol, GeoDiff를 능가한다.
  • 토션 확산은 Recall 72.7% 및 80.0%를, Precision 0.582 및 0.565를 평균/중앙값으로 달성하여 이전 방법을 능가한다.
  • 유클리드 확산 벤치마크에 비해 현저히 적은 denoising 단계가 필요하며(GeoDiff의 수천 단계에 비해 5–20단계 수준), 더 우수한 엔SEMBLE 품질을 제공한다.
  • 에너지, 쌍극자, HOMO-LUMO 간격과 같은 엔SEMBLE 속성이 실제 값과의 정합이 개선되었고, 중앙값 기준으로 최저 에너지 콘포머가 전역 최소값에서 0.13 kcal/mol 이내이다.
  • 토션 볼츠만 생성기는 미확인 분자에 걸친 볼츠만 분포의 일반화 가능한 샘플링을 가능하게 하며, AIS 벤치마크 대비 유효 샘플 수에서 우수하고, 보통의 재샘플링 단계로 달성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.