Skip to main content
QUICK REVIEW

[论文解读] OnionNet-2

Zechen Wang|arXiv (Cornell University)|Feb 29, 2024
Computational Drug Discovery Methods参考文献 61被引用 117
一句话总结

OnionNet-2 是一种二维卷积神经网络,通过在多个距离层中建模残基-原子相互作用来预测蛋白质-配体结合亲和力(ΔG),在 CASF-2016 和 CASF-2013 基准测试中达到最先进性能,皮尔逊相关系数分别为 0.864 和 0.821,优于先前的深度学习方法和传统打分函数。

ABSTRACT

One key task in virtual screening is to accurately predict the binding affinity (△<italic>G</italic>) of protein-ligand complexes. Recently, deep learning (DL) has significantly increased the predicting accuracy of scoring functions due to the extraordinary ability of DL to extract useful features from raw data. Nevertheless, more efforts still need to be paid in many aspects, for the aim of increasing prediction accuracy and decreasing computational cost. In this study, we proposed a simple scoring function (called OnionNet-2) based on convolutional neural network to predict △<italic>G</italic>. The protein-ligand interactions are characterized by the number of contacts between protein residues and ligand atoms in multiple distance shells. Compared to published models, the efficacy of OnionNet-2 is demonstrated to be the best for two widely used datasets CASF-2016 and CASF-2013 benchmarks. The OnionNet-2 model was further verified by non-experimental decoy structures from docking program and the CSAR NRC-HiQ data set (a high-quality data set provided by CSAR), which showed great success. Thus, our study provides a simple but efficient scoring function for predicting protein-ligand binding free energy.

研究动机与目标

  • 开发一种更准确且高效的基于深度学习的打分函数,用于预测蛋白质-配体结合自由能(ΔG)。
  • 通过利用残基层面的相互作用而非仅依赖原子层面的特征,提升预测准确性。
  • 在保持虚拟筛选应用中高性能的同时降低计算成本。
  • 在包括实验和非实验性诱饵结构在内的多样化数据集上验证模型性能。

提出的方法

  • 模型使用围绕每个配体原子的多个同心距离层中的旋转不变、元素特异性残基-原子接触计数。
  • 距离层以基底半径 d₀ 和增量厚度 δ 定义,用于捕捉蛋白质残基与配体原子之间的空间邻近性。
  • 配体原子被划分为八种类别:C、H、O、N、P、S、HAL(卤素)和 DU(其他元素)。
  • 二维卷积神经网络处理接触矩阵(残基 × 配体原子)以预测 ΔG,输入特征源自接触频率。
  • 模型在 PDBbind 数据集(v.2016、v.2018、v.2019)上进行端到端训练,并使用标准 CASF 基准进行验证。
  • 非实验性诱饵通过 AutoDock Vina 生成,用于测试模型在多样化结合构象下的鲁棒性。

实验结果

研究问题

  • RQ1通过多层接触特征在残基-原子层面建模蛋白质-配体相互作用,是否能提升相对于仅基于原子层面模型的 ΔG 预测准确性?

主要发现

  • OnionNet-2 在 CASF-2016 核心集上实现了皮尔逊相关系数 0.864 和均方根误差 1.164,优于所有对比模型,包括 AGL、K deep 和 RF-Score-v3。
  • 在 CASF-2013 基准测试中,OnionNet-2 实现 R = 0.821 和 RMSE = 1.29,相较于其前身 OnionNet 提升了 3.7% 的预测能力。
  • 模型在由 AutoDock Vina 生成的非实验性诱饵结构上保持了优异性能,证实了其在多样化结合构象下的鲁棒性。
  • OnionNet-2 在 CSAR NRC-HiQ 数据集上实现了高相关性(R > 0.8),验证了其在高质量、多样化实验数据上的泛化能力。
  • 与仅使用原子层面特征相比,采用残基层面特征显著提升了模型性能,表明残基特异性物理化学性质对准确预测结合亲和力至关重要。
  • 在多个版本的 PDBbind(v.2016、v.2018、v.2019)上进行训练显示出一致的性能表现,模型在不同数据划分中均保持稳定结果。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。