[论文解读] De novo design of high-affinity protein binders with AlphaProteo
AlphaProteo 使用生成式模型与筛选器的两组件系统,设计新型蛋白质结合子,以在多种靶标上实现亚纳摩尔到低纳摩尔亲和力,并在多样靶标上具有高实验成功率,通常仅需一轮中等通量筛选且无需进一步优化。
Computational design of protein-binding proteins is a fundamental capability with broad utility in biomedical research and biotechnology. Recent methods have made strides against some target proteins, but on-demand creation of high-affinity binders without multiple rounds of experimental testing remains an unsolved challenge. This technical report introduces AlphaProteo, a family of machine learning models for protein design, and details its performance on the de novo binder design problem. With AlphaProteo, we achieve 3- to 300-fold better binding affinities and higher experimental success rates than the best existing methods on seven target proteins. Our results suggest that AlphaProteo can generate binders "ready-to-use" for many research applications using only one round of medium-throughput screening and no further optimization.
研究动机与目标
- 推动对不同靶标进行高亲和力蛋白结合子计算设计,且无需迭代优化。
- 将 AlphaProteo 介绍为一个生成设计 + 过滤框架。
- 在多种结构多样的靶标上展示实验验证。
- 证明设计的结合子具有热稳定性、可表达性,并对表位特异。
提出的方法
- 两组件的 AlphaProteo 系统:在 PDB 结构/序列数据上训练的生成模型,以及一个 AlphaFold 预测的蒸馏集。
- 一个对设计进行评分以预测实验成功的筛选器。
- 输入靶标结构并可选加热点残基以条件化设计。
- 离线/计算生成大量结合子候选体,然后通过自动筛选缩小到较小的实验集合。
- 通过酵母表面展示进行实验测试,以测量结合命中和亲和力(K_D)。
- 生化、生物物理和结构验证(HTRF、BLI、CD、cryo-EM、X-ray 结晶学)。
实验结果
研究问题
- RQ1AlphaProteo 是否能针对结构多样的靶标生成新生的结合子,并获得高实验成功率?
- RQ2在多个靶标上,未经过设计后优化即可达到的结合亲和力(K_D)是多少?
- RQ3设计的结合子是否与目标表位结合并展示特异性?
- RQ4结合子在结构上是否多样并具备足够的热稳定性以供实际使用?
- RQ5计算内性能对额外未测试靶标的泛化能力如何?
主要发现
- AlphaProteo 在七个靶标中实现的实验成功率介于 9% 到 88% 之间,在这六个靶标上超越了现有最佳方法。
- 单靶标最佳 K_D 值在四个靶标上为亚 1 nM,在七个靶标上为亚 30 nM,最佳结合子为 82 pM。
- 在七个靶标中,AlphaProteo 结合子在结合亲和力上比最优先前设计的结合子高出 3 到 300 倍。
- 设计的结合子在结构上多样(全-alpha、全-beta、混合折叠),并对目标表位特异结合,具有竞争性抑制和界面-突变分析支持所设计的相互作用。
- Cryo-EM 和 X-ray 晶体学确认了结合子-靶标复合物的结构,与设计高度一致(RMSD ~0.8–3.1 Å;VEGF-A 复合物为 0.78 Å)。
- 功能验证显示所设计的结合子在活病毒实验中中和 SARS-CoV-2,以及在人体细胞中抑制 VEGF 信号传导。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。