QUICK REVIEW

[논문 리뷰] OnionNet-2

Zechen Wang|arXiv (Cornell University)|2024. 02. 29.

Computational Drug Discovery Methods참고 문헌 61인용 수 117

한 줄 요약

OnionNet-2는 단백질-리간드 결합 친화도(ΔG)를 예측하기 위해 다중 거리 셸 내 잔기-원자 접촉을 모델링하는 2차원 합성곱 신경망이다. CASF-2016 및 CASF-2013 벤치마크에서 각각 피어슨 상관계수 0.864와 0.821을 기록하며 최신 기술 수준의 성능을 달성했으며, 이는 이전의 딥러닝 및 전통적 스코링 함수를 뛰어넘는 성과이다.

ABSTRACT

One key task in virtual screening is to accurately predict the binding affinity (△<italic>G</italic>) of protein-ligand complexes. Recently, deep learning (DL) has significantly increased the predicting accuracy of scoring functions due to the extraordinary ability of DL to extract useful features from raw data. Nevertheless, more efforts still need to be paid in many aspects, for the aim of increasing prediction accuracy and decreasing computational cost. In this study, we proposed a simple scoring function (called OnionNet-2) based on convolutional neural network to predict △<italic>G</italic>. The protein-ligand interactions are characterized by the number of contacts between protein residues and ligand atoms in multiple distance shells. Compared to published models, the efficacy of OnionNet-2 is demonstrated to be the best for two widely used datasets CASF-2016 and CASF-2013 benchmarks. The OnionNet-2 model was further verified by non-experimental decoy structures from docking program and the CSAR NRC-HiQ data set (a high-quality data set provided by CSAR), which showed great success. Thus, our study provides a simple but efficient scoring function for predicting protein-ligand binding free energy.

연구 동기 및 목표

단백질-리간드 결합 자유 에너지(ΔG)를 예측하기 위한 더 정확하고 효율적인 딥러닝 기반 스코링 함수 개발.
원자 수준의 특징만을 사용하는 것과는 달리 잔기 수준의 상호작용을 활용하여 예측 정확도 향상.
가상 스크리닝 응용 프로그램에서 높은 성능를 유지하면서도 계산 비용을 감소.
실험적 및 비실험적 디코이 구조를 포함한 다양한 데이터셋에서 모델의 유효성 검증.

제안 방법

모델은 각 리간드 원자 주변의 다중 농도의 동심 거리 셸 내에서 회전 불변성, 원소 특이적인 잔기-원자 접촉 수를 사용한다.
거리 셸은 기본 반경 d₀와 간격 두께 δ로 정의되며, 단백질 잔기와 리간드 원자 간의 공간적 근접도를 캡처한다.
리간드 원자는 8종류로 분류된다: C, H, O, N, P, S, HAL(할로겐), DU(기타 원소).
접촉 행렬(잔기 × 리간드 원자)을 2차원 합성곱 신경망이 처리하여 ΔG를 예측하며, 입력 특징은 접촉 빈도에서 유도된다.
모델은 PDBbind 데이터셋(v.2016, v.2018, v.2019)에서 엔드 투 엔드로 훈련되고, 표준 CASF 벤치마크를 사용하여 검증된다.
비실험적 디코이 구조는 AutoDock Vina를 통해 생성되었으며, 다양한 결합 자세에 대한 견고성 테스트에 사용되었다.

실험 결과

연구 질문

RQ1다중 셸 접촉 특징을 활용해 잔기-원자 수준에서 단백질-리간드 상호작용을 모델링하면 원자 수준 모델 대비 ΔG 예측 정확도 향상이 가능한가?

주요 결과

OnionNet-2는 CASF-2016 코어 세트에서 피어슨 상관계수 0.864와 RMSE 1.164를 기록했으며, AGL, K deep, RF-Score-v3를 포함한 모든 비교 모델을 뛰어넘었다.
CASF-2013 벤치마크에서 OnionNet-2는 R = 0.821과 RMSE = 1.29를 기록했으며, 이전 모델인 OnionNet 대비 3.7% 향상된 예측 능력을 보였다.
AutoDock Vina로 생성한 비실험적 디코이 구조에서도 높은 성능를 유지하여 다양한 결합 자세에 대한 견고성이 확인되었다.
CSAR NRC-HiQ 데이터셋에서 높은 상관계수(R > 0.8)를 기록하여, 고품질이고 다양한 실험 데이터에 대한 일반화 능력이 검증되었다.
원자 수준의 특징이 아닌 잔기 수준의 특징을 사용함으로써 모델 성능이 크게 향상되었으며, 이는 잔기 특유의 물리화학적 성질이 정확한 결합 친화도 예측에 핵심적임을 시사한다.
PDBbind의 여러 버전(v.2016, v.2018, v.2019)에서 훈련한 결과, 다양한 데이터 분할에서도 안정적인 성능가지며 일관성 있는 결과를 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.