Skip to main content
QUICK REVIEW

[논문 리뷰] Symmetry-adapted generation of 3d point sets for the targeted discovery of molecules

Niklas W. A. Gebauer, Michael Gastegger|arXiv (Cornell University)|2019. 06. 02.
Machine Learning in Materials Science참고 문헌 66인용 수 66
한 줄 요약

저자들은 G-SchNet를 도입한다, 회전 불변의 3D 점 집합(원자 위치)을 분자에 대해 생성하는 자기회귀 네트워크로, 3D 기하를 포착하고 작은 HOMO-LUMO 간격과 같은 특성에 대한 편향을 가능하게 한다. 그들은 QM9에서 검증하고, 평형 구조에 근접함을 나타내며, 새로운 분자 데이터셋을 만든다.

ABSTRACT

Deep learning has proven to yield fast and accurate predictions of quantum-chemical properties to accelerate the discovery of novel molecules and materials. As an exhaustive exploration of the vast chemical space is still infeasible, we require generative models that guide our search towards systems with desired properties. While graph-based models have previously been proposed, they are restricted by a lack of spatial information such that they are unable to recognize spatial isomerism and non-bonded interactions. Here, we introduce a generative neural network for 3d point sets that respects the rotational invariance of the targeted structures. We apply it to the generation of molecules and demonstrate its ability to approximate the distribution of equilibrium structures using spatial metrics as well as established measures from chemoinformatics. As our model is able to capture the complex relationship between 3d geometry and electronic properties, we bias the distribution of the generator towards molecules with a small HOMO-LUMO gap - an important property for the design of organic solar cells.

연구 동기 및 목표

  • geometry-aware 분자 생성이 그래프 기반 방법을 넘어 공간 이성질체 및 비결합 상호작용을 포착하도록 동기를 부여한다.
  • G-SchNet을 제안하여 회전 및 병진 불변성을 갖는 3D 원자 위치와 타입을 생성한다.
  • QM9에서 기초적이며 균형에 가까운 구조를 생성하고 구조적 및 공간적 충실도를 평가한다.
  • 작은 HOMO-LUMO 간격과 같은 원하는 전자 특성으로 편향될 수 있는 방법을 보여준다.
  • 추가 분석 및 벤치마킹을 위한 새로운 생성 분자 데이터셋을 제공한다.

제안 방법

  • 점집합 분포의 자기회귀 인수분해를 회전, 병진 및 국소 대칭에 대해 대칭적으로 적용한다.
  • 이전 배치된 점들에 조건부로 거리 기반 확률을 사용하여 다음 원자 타입과 위치를 생성한다.
  • 샘플링을 국소화하고 전역 기하를 인코딩하기 위해 초점점과 원점과 같은 보조 토큰(auxiliary tokens)을 활용한다.
  • 회전/병진 불변의 원자 특징을 얻기 위해 연속 필터 컨볼루션 계층을 갖춘 SchNet 기반 신경망을 사용한다.
  • 타입 분포는 이전 포인트별 가능도들의 곱(Eq. 4)으로 예측하고, 거리 분포는 이산 구간으로(Eq. 3) 예측한다.
  • 생성 종료를 위한 stop 토큰과 함께 타입 및 거리 분포에 대해 교차 엔트로피 손실로 학습한다.

실험 결과

연구 질문

  • RQ1G-SchNet가 QM9의 구조 통계와 유사한 평형 기하를 가진 3D 분자 구조를 생성하고 재현할 수 있는가?
  • RQ2생성된 구조가 학습 데이터와 비교했을 때 공간 분포(반지름/각도)가 올바르게 나타나는가?
  • RQ3모델을 작은 HOMO-LUMO 간격과 같은 원하는 전자 특성을 가진 분자를 늘리도록 편향할 수 있는가?
  • RQ4생성의 타당성, 새로움 및 구조적 특징 측면에서 G-SchNet가 그래프 기반 분자 생성기와 어떻게 비교되는가?
  • RQ5추가 검증 및 벤치마킹을 위해 새로 생성된 분자 데이터셋으로 어떤 데이터를 제공할 수 있는가?

주요 결과

  • 생성된 분자 중 약 77%가 생성 및 원자수/원자결합 정합성 검사를 거쳐 유효하다.
  • 보지 않은/테스트 데이터에 대해 Relaxed 평형 구조와 비교 시 생성 분자의 RMSD 중앙값이 약 0.21 Å 범위이다.
  • 생성된 분자의 반지름 분포(RDF) 및 각도 분포가 QM9 학습 데이터와 잘 맞아 공간 통계를 충실하게 반영한다.
  • 작은 HOMO-LUMO 간격으로 편향을 조정하면 자격 있는 분자 비율이 7%에서 43%로 증가한다.
  • 저자들은 QM9에 존재하지 않는 수천 개의 신규 분자를 포함하는 데이터셋(9k 이상 신규 구조체; >3.6k 편향 구조체)을 도입한다.
  • 필터링된 부분집합(예: 작은 고리는 피하는 경우)에 대해 학습시킨 경우 생성 구조가 원자/결합 수를 보존하고 학습 데이터의 고리 통계와 닮아 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.