[论文解读] NeuralPLexer3: Accurate Biomolecular Complex Structure Prediction with Flow Models
NeuralPLexer3 (NP3) 使用受物理启发的基于流的生成模型来预测生物分子复合物结构,达到最先进的准确性,推理速度比先前的方法(包括 AlphaFold3)更快。在多样的生物分子相互作用中,它实现了强物理有效性和配体诱导的构象预测。
Structure determination is essential to a mechanistic understanding of diseases and the development of novel therapeutics. Machine-learning-based structure prediction methods have made significant advancements by computationally predicting protein and bioassembly structures from sequences and molecular topology alone. Despite substantial progress in the field, challenges remain to deliver structure prediction models to real-world drug discovery. Here, we present NeuralPLexer3 -- a physics-inspired flow-based generative model that achieves state-of-the-art prediction accuracy on key biomolecular interaction types and improves training and sampling efficiency compared to its predecessors and alternative methodologies. Examined through newly developed benchmarking strategies, NeuralPLexer3 excels in vital areas that are crucial to structure-based drug design, such as physical validity and ligand-induced conformational changes.
研究动机与目标
- 从序列和拓扑出发推进对广义生物分子复合物结构(蛋白质、核酸、配体、离子、PTMs)的从头预测。
- 提高结构建模中的物理有效性和配体诱导的构象预测。
- 提升相对于前代和竞争方法的训练与采样效率。
- 建立基准测试(PoseBusters, NPBench, ConfBench)以评估相互作用类型、构象变化和物理化学可行性。
提出的方法
- 使用条件基于流的生成模型,采用连续归一化流来从信息先验采样所有重原子坐标。
- 通过具有 Langevin 弛豫的球状聚合物模型引入物理启发先验,以生成可信的初始构型。
- 应用带对称感知置换模块的流匹配和向量场重参数化,以实现稳定、高效的训练。
- 采用带锚点条件的编码-解码架构、MSA 派生特征,以及具有几何偏置的扩散-变换器解码器。
- 引入 Flash-TriangularAttention 以降低内存和推理时间,使更大的裁切尺寸成为可能,预测更快。
- 将 NP3 与 PoseBusters、NPBench、CASP15 RNA 目标进行基准测试,并报告包括 RMSD、PB-valid、LDDT 和 DockQ 的指标。
实验结果
研究问题
- RQ1NP3 是否能够在多样的生物分子相互作用中超越 AlphaFold3 的蛋白-配体结合结构预测?
- RQ2物理信息先验和高效采样器如何影响结构预测的物理有效性和速度?
- RQ3NP3 在跨多种生物分子模态的配体诱导构象变化和 PTMs 上的表现如何?
- RQ4新基准(NPBench、ConfBench)在多大程度上揭示了先进模型的构象与相互作用预测能力?
主要发现
- NP3 在 PoseBusters-V2 上在 RMSD 与 PB-valid 标准的综合成功率达到 78.4%,超过 AlphaFold3 的 73.1%。
- NP3 在配体结合预测上实现 80.2% 的 RMSD < 2 Å,与 AlphaFold3 的 80.4% 相当,且在预测配体手性方面达到 98.8% 的准确性。
- NP3 推理更快,在单个 L40S GPU 上大约 30 秒就可给出结果,而 AlphaFold3 reported 大约六个 A100 分钟的时间,相对于 AF3 的时序统计,预测速度提高约 15 倍。
- 在 PoseBusters 上,NP3 对低同源性蛋白-蛋白界面的 DockQ > 0.23 的成功率为 52.7%,对蛋白单体的 LDDT 为 87.1%,与 AlphaFold2-Multimer 在类似任务上的结果接近。
- NP3 在 NPBench、CASP15 RNA 目标(46.5% vs 47.3% 的 AF3)和蛋白质-核酸界面上展现出强健的跨目标性能,表明具有广泛的泛化能力。
- ConfBench 基准测试显示 NP3 在无配体/有配体口袋构象方面优于 AF2-M,整体 apo 为 67.4%、 holo 为 69.9% 的正确性;而针对激酶的结果显示 apo 77.8%、 holo 72.5% 的正确性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。