Skip to main content
QUICK REVIEW

[논문 리뷰] Hierarchical, rotation-equivariant neural networks to predict the structure of protein complexes

Stephan Eismann, Raphael J.L. Townshend|arXiv (Cornell University)|2020. 06. 05.
Computational Drug Discovery Methods참고 문헌 31인용 수 7
한 줄 요약

이 논문은 사전에 계산된 특징에 의존하지 않고 원자 좌표에서 직접 정확한 단백질 복합체 구조를 예측할 수 있도록 설계된 계층적, 회전 등변성 신경망을 소개한다. 점 기반 표현, 회전 및 이동에 대한 등변성, 국소 컨벌루션, 계층적 서브샘플링을 결합함으로써 모델은 구조적 모델의 스코어링을 향상시키고 절대 정확도를 예측하며, 기존 방법들보다 우수한 성능을 보인다. 이는 기존의 스코어링 함수와 조합했을 때 성능 향상이 이루어진다.

ABSTRACT

Predicting the structure of multi-protein complexes is a grand challenge in biochemistry, with major implications for basic science and drug discovery. Computational structure prediction methods generally leverage pre-defined structural features to distinguish accurate structural models from less accurate ones. This raises the question of whether it is possible to learn characteristics of accurate models directly from atomic coordinates of protein complexes, with no prior assumptions. Here we introduce a machine learning method that learns directly from the 3D positions of all atoms to identify accurate models of protein complexes, without using any pre-computed physics-inspired or statistical terms. Our neural network architecture combines multiple ingredients that together enable end-to-end learning from molecular structures containing tens of thousands of atoms: a point-based representation of atoms, equivariance with respect to rotation and translation, local convolutions, and hierarchical subsampling operations. When used in combination with previously developed scoring functions, our network substantially improves the identification of accurate structural models among a large set of possible models. Our network can also be used to predict the accuracy of a given structural model in absolute terms. The architecture we present is readily applicable to other tasks involving learning on 3D structures of large atomic systems.

연구 동기 및 목표

  • 수작업으로 설계된 특징에 의존하지 않고 원자 좌표에서 직접 정확한 단백질 복합체 구조를 식별할 수 있는 기계학습 방법을 개발하는 것.
  • 다중 단백질 복합체의 후보 구조적 모델 집합에 대한 스코어링 과제를 해결하는 것.
  • 수천 개의 원자로 이루어진 시스템에서 3차원 원자 위치로부터 종단간(end-to-end) 학습을 가능하게 하는 것.
  • 다른 후보자들 사이의 상대적 순위가 아니라 주어진 구조적 모델의 절대 정확도를 예측하는 것.
  • 단백질 복합체를 넘어서 큰 3차원 원자 시스템에서 학습에 적용 가능한 일반화 가능한 아키텍처를 만드는 것.

제안 방법

  • 모델은 각 원자를 3차원 좌표와 관련된 특징로 간주하는 점 기반 표현을 사용한다.
  • 기하학적 딥 러닝 원리를 통해 회전 및 이동에 대한 등변성을 강제함으로써 공간 변환에 대해 일관된 예측을 보장한다.
  • 각 원자 주변의 국소 구조 패턴을 포착하기 위해 국소 컨벌루션을 적용한다.
  • 계층적 서브샘플링을 통해 계산 복잡도를 줄이면서도 여러 척도에서의 구조적 계층성을 유지한다.
  • 물리 기반 또는 통계적 기술을 사용하지 않고 원자 좌표에서 직접 예측을 위한 종단간 학습을 수행한다.
  • 기존의 스코어링 함수와 통합하여 그 성능을 향상시키는 데 사용된다.

실험 결과

연구 질문

  • RQ1딥 러닝 모델이 사전에 정의된 구조적 특징 없이 원자 좌표에서 직접 정확한 단백질 복합체 구조를 식별할 수 있는가?
  • RQ23차원 분자 구조 예측에서 회전 및 이동 등변성이 성능 향상에 얼마나 기여하는가?
  • RQ3모델은 상대적 순위가 아니라 주어진 구조적 모델의 절대 정확도를 예측할 수 있는가?
  • RQ4대규모 분자 시스템(수천 개의 원자 포함)을 다룰 때 계층적 점 기반 아키텍처의 효과는 어떠한가?
  • RQ5이 아키텍처는 3차원 원자 구조를 다루는 다른 작업으로 일반화될 수 있는가?

주요 결과

  • 제안된 신경망은 기존의 스코어링 함수와 조합했을 때 정확한 구조적 모델 식별 능력을 크게 향상시킨다.
  • 모델은 수작업으로 설계된 특징(물리 기반 또는 통계적 기술 포함)이 필요 없이 원자 좌표에서 직접 종단간 학습을 수행한다.
  • 계층적 서브샘플링과 국소 컨벌루션을 통해 수천 개의 원자를 포함하는 분자 시스템을 성공적으로 처리한다.
  • 네트워크는 주어진 구조적 모델의 절대 정확도를 예측하여 모델 품질에 대한 정량적 측정치를 제공한다.
  • 회전 및 이동 등변성 설계 덕분에 동일한 복합체의 다양한 공간적 방향에서 일관된 예측을 보장한다.
  • 이 방법은 일반화 가능하며 단백질 복합체를 넘어서 큰 원자 시스템의 3차원 구조 학습에 적용 가능한 다른 작업에 활용될 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.