[論文レビュー] HelixFold-Multimer: Elevating Protein Complex Structure Prediction to New Heights
HelixFold-Multimer はタンパク質複合体構造予測を大幅に改善し、特に抗原-抗体、ナノボディ-抗原、ペプチド-タンパク質の界面で、いくつかのシナリオで AlphaFold-Multimer を上回り、PaddleHelixで公開されています。
While monomer protein structure prediction tools boast impressive accuracy, the prediction of protein complex structures remains a daunting challenge in the field. This challenge is particularly pronounced in scenarios involving complexes with protein chains from different species, such as antigen-antibody interactions, where accuracy often falls short. Limited by the accuracy of complex prediction, tasks based on precise protein-protein interaction analysis also face obstacles. In this report, we highlight the ongoing advancements of our protein complex structure prediction model, HelixFold-Multimer, underscoring its enhanced performance. HelixFold-Multimer provides precise predictions for diverse protein complex structures, especially in therapeutic protein interactions. Notably, HelixFold-Multimer achieves remarkable success in antigen-antibody and peptide-protein structure prediction, greatly surpassing AlphaFold 3. HelixFold-Multimer is now available for public use on the PaddleHelix platform, offering both a general version and an antigen-antibody version. Researchers can conveniently access and utilize this service for their development needs.
研究の動機と目的
- モノマー中心のモデルを超えて、複数鎖タンパク質複合体構造予測の精度を向上させる。
- アーキテクチャ、特徴、学習にドメイン知識を組み込み、鎖間相互作用のモデリングを改善する。
- 抗原-抗体およびペプチド-タンパク質複合体を含む治療用タンパク質相互作用の信頼性ある予測を実現する。
- PaddleHelixプラットフォーム上で、公開・使いやすさを重視した一般版と抗原-抗体版を提供する。
提案手法
- HelixFoldと HelixFold-Single を基盤にした general および antigen-antibody の2つのバージョンを開発する。
- 主指標としてDockQを用い、AlphaFoldおよびRoseTTAFoldと比較評価する。
- pLDDT、PTM、iPTM、および信頼性スコアを用いてモデルの信頼性を評価し、DockQと相関させる。
- キュレーションされたデータセット上で評価する:異種複合体タンパク質複合体、タンパク質-ペプチド複合体、抗原-抗体、ナノボディ-抗原の界面。
- 種を跨る性能と訓練データへの抗原配列同一性を分析し、一般化を理解する。
実験結果
リサーチクエスチョン
- RQ1HelixFold-Multimer は異種タンパク質複合体およびペプチド-タンパク質界面の予測で AlphaFold-Multimer を上回ることができるか。
- RQ2抗原-抗体およびナノボディ-抗原界面における HelixFold-Multimer の性能は、ベースラインと比べてどうか。
- RQ3抗体関連予測における信頼性指標(CFS、iPTM、pLDDT)と DockQ の精度との関係は何か。
- RQ4抗原の種の起源と訓練データへの配列同一性は予測精度に影響するか。
主な発見
- HelixFold-Multimerを用いた異種複合体の中央値 DockQ は 0.304 で、AlphaFold (0.316) と同等。
- 異種複合体における精度は 57.8%(DockQ > 0.23)、AlphaFold の 53.6% と比較。
- タンパク質-ペプチド ドックには、中央値 DockQ が 0.295、DockQ > 0.23 の成功率が 68.9%、AlphaFold(中央値 0.262、成功率 54.1%)を上回る。
- 抗体-抗原界面: HelixFold-Multimer の平均 DockQ は 0.390、DockQ > 0.23 は 52.7%、対して AlphaFold の平均は 0.195、RoseTTAFold は 0.?(低い)。
- ナノボディ-抗原界面: 中央値 DockQ 0.703、平均 0.538、DockQ > 0.23 が 69.2%、AlphaFoldおよび RoseTTAFold を上回る。
- VH-VL抗体界面: HelixFold-Multimer の中央値 DockQ は 0.823、AlphaFold は 0.774、RoseTTAFold は 0.653;DockQ > 0.8 の割合は 59.5% 対し、AlphaFold 37.4%、RoseTTAFold 19.1%。
- 信頼度指標(CFS と iPTM)は DockQ と強く相関し、抗体設計に信頼性の高い信頼度指針を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。