[논문 리뷰] AtomNet: A Deep Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery
AtomNet는 3차원 분자의 구조적 국소성과 계층적 특징 조합을 활용하여 결합 친화도를 예측하는 최초의 딥 컨volution 뉴럴 네트워크이다. 전통적인 도킹 방법보다 뛰어난 성능을 보이며, DUDE 벤치마크에서 57.8%의 타겟에서 AUC > 0.9를 달성했고, 알려진 조절제가 없는 타겟에 대해서도 활성 분자를 성공적으로 식별했다.
Deep convolutional neural networks comprise a subclass of deep neural networks (DNN) with a constrained architecture that leverages the spatial and temporal structure of the domain they model. Convolutional networks achieve the best predictive performance in areas such as speech and image recognition by hierarchically composing simple local features into complex models. Although DNNs have been used in drug discovery for QSAR and ligand-based bioactivity predictions, none of these models have benefited from this powerful convolutional architecture. This paper introduces AtomNet, the first structure-based, deep convolutional neural network designed to predict the bioactivity of small molecules for drug discovery applications. We demonstrate how to apply the convolutional concepts of feature locality and hierarchical composition to the modeling of bioactivity and chemical interactions. In further contrast to existing DNN techniques, we show that AtomNet's application of local convolutional filters to structural target information successfully predicts new active molecules for targets with no previously known modulators. Finally, we show that AtomNet outperforms previous docking approaches on a diverse set of benchmarks by a large margin, achieving an AUC greater than 0.9 on 57.8% of the targets in the DUDE benchmark.
연구 동기 및 목표
- 리간드와 타겟의 3차원 구조적 정보를 이용해 분자의 생활성을 예측하는 딥 러닝 모델을 개발한다.
- 기존 리간드 기반 모델의 한계를 극복하여 알려진 활성 화합물에 의존하고 타겟의 구조적 맥락을 반영하지 못하는 문제를 해결한다.
- 학습 과정에 타겟 구조를 통합하여 이전에 알려진 조절제가 없는 타겟에 대해 새로운 활성 화합물을 예측할 수 있도록 한다.
- 컨volution 뉴럴 네트워크가 분자 결합에서 국소적이고 공간적으로 제약된 화학적 상호작용을 효과적으로 모델링할 수 있음을 입증한다.
- DUDE 및 ChEMBL과 같은 표준 벤치마크에서 Smina와 같은 기존 도킹 도구를 능가하는 성능을 보임을 입증한다.
제안 방법
- AtomNet는 리간드와 타겟 단백질의 원자 배치를 나타내는 3차원 격자(3D grid)를 처리하기 위해 3차원 컨volution 뉴럴 네트워크(3D-CNN) 아키텍처를 사용한다.
- 지역적이고 가중치 공유 필터를 사용하여 수소 결합이나 π-스택과 같은 근접한 화학적 기능을 탐지함으로써 파rameter 공유와 일반화 능력 향상을 달성한다.
- 지역적 특징의 계층적 조합을 통해 여러 레이어를 거쳐 분자 상호작용의 점점 더 복잡한 표현을 학습할 수 있다.
- 입력 데이터는 각 볼록체(voxel)가 원자 유형, 부분 전하 및 공간 좌표를 나타내도록 3차원 볼록체 격자로 인코딩되어 있어 공간 인식 능력이 있다.
- 모델은 바이너리 크로스엔트로피 손실을 사용하여 각 리간드-타겟 쌍의 결합 친화도(활성/비활성)를 예측하기 위해 다중 작업 학습 설정으로 엔드 투 엔드로 훈련된다.
- 필터 시각화는 필터가 가장 강하게 반응하는 입력 영역을 식별하여, 직접적인 필터 시각화 없이도 학습된 화학적 기능을 해석할 수 있도록 한다.
실험 결과
연구 질문
- RQ1딥 컨volution 뉴럴 네트워크는 단백질-리간드 결합에서 국소적이고 공간적으로 제약된 상호작용의 특성을 효과적으로 모델링할 수 있는가?
- RQ2타겟 단백질의 3차원 구조 정보를 통합하면, 이전에 알려진 조절제가 없는 신규 타겟의 생활성 예측 성능을 향상시킬 수 있는가?
- RQ3표준 벤치마크에서 3D-CNN 아키텍처가 기존 도킹 도구보다 리간드의 결합 친화도 예측 성능에서 뛰어나게 되는가?
- RQ4필터 활성 패턴을 통해 모델이 자율적으로 화학적으로 의미 있는 기능(예: 기능기)을 탐지할 수 있는가?
- RQ5AtomNet는 이전에 알려진 활성 리간드가 없는 타겟으로 일반화되는 정도는 어느 정도인가?
주요 결과
- AtomNet는 DUDE 벤치마크에서 57.8%의 타겟에서 AUC가 0.9를 초과하여 이전의 도킹 방법보다 뚜렷이 뛰어난 성능을 보였다.
- DUDE-102 벤치마크에서 AtomNet는 평균 AUC 0.895와 평균 logAUC 0.385를 기록했고, DOCK3.7는 각각 0.696과 0.174를 기록했다.
- AtomNet는 알려진 조절제가 없는 타겟에 대해 활성 분자를 성공적으로 예측하여 데이터가 부족한 상황에서도 일반화 능력을 입증했다.
- 필터 시각화 결과, 학습된 필터가 사전 화학 지식 없이도 스уль포닐/설폰아미드 기능기와 같은 특정 화학 기능을 탐지하는 것으로 밝혀졌다.
- ChEMBL-20 PMD 벤치마크에서 AtomNet는 50개 타겟 중 27개에서 AUC 기준을 충족했고, Smina는 16개에 그쳤다.
- ChEMBL-20 비활성 벤치마크에서 AtomNet는 조정된 logAUC ≥ 0.3인 149개 타겟 중 107개의 활성 화합물을 식별했고, Smina는 35개에 그쳤다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.