QUICK REVIEW

[論文レビュー] Iterative Refinement Graph Neural Network for Antibody Sequence-Structure Co-design

Wengong Jin, Jeremy Wohlwend|arXiv (Cornell University)|Oct 9, 2021

Monoclonal and Polyclonal Antibodies Research参考文献 41被引用数 66

ひとこと要約

論文はRefineGNNを紹介する。反復的なグラフニューラルネットワークを用いて抗体配列と3D構造を共同設計し、言語モデリング、抗原結合設計、SARS-CoV-2中和タスクでベースラインを上回る。

ABSTRACT

Antibodies are versatile proteins that bind to pathogens like viruses and stimulate the adaptive immune system. The specificity of antibody binding is determined by complementarity-determining regions (CDRs) at the tips of these Y-shaped proteins. In this paper, we propose a generative model to automatically design the CDRs of antibodies with enhanced binding specificity or neutralization capabilities. Previous generative approaches formulate protein design as a structure-conditioned sequence generation task, assuming the desired 3D structure is given a priori. In contrast, we propose to co-design the sequence and 3D structure of CDRs as graphs. Our model unravels a sequence autoregressively while iteratively refining its predicted global structure. The inferred structure in turn guides subsequent residue choices. For efficiency, we model the conditional dependence between residues inside and outside of a CDR in a coarse-grained manner. Our method achieves superior log-likelihood on the test set and outperforms previous baselines in designing antibodies capable of neutralizing the SARS-CoV-2 virus.

研究の動機と目的

配列と3D構造を同時にモデリングすることで抗体CDRの自動設計を動機づける。
配列と構造の両方を反復的に洗練させるグラフ生成手法を開発する。
固定されたフレームワーク領域とマルチ解像度コンテキストを用いた条件付き生成を可能にする。
言語モデリング、抗原結合設計、SARS-CoV-2中和最適化の評価を行う。

提案手法

残基のノード特徴と空間的関係を捉えるエッジ特徴を持つ、抗体をシーケンス-構造グラフとして表現する。
次の残基を予測することと、反復的なグラフ精錬を通じて全体の3D構造を洗練させることを交互に行うRefineGNNを提案する。
配列ラベルと座標を予測するために2つの別個のMPNを用い、構造化された回転/平行移動不変な損失を可能にする。
粗粒度のコンテキストブロックを組み込み、長い文脈から情報を効率的に伝搬させる。
注意機構とマルチ解像度コンテキスト（ブロック粗粒化コンテキスト）を介して固定フレームワークでの条件付き生成へ拡張する。
ITAベースのファインチューニングを適用して、生成抗体を望ましい特性（例：中和）に最適化する。

実験結果

リサーチクエスチョン

RQ1グラフベースの反復的洗練手法は、シーケンスのみまたはワンショットのグラフ手法よりも効果的に抗体配列と構造を同時に生成できるか。
RQ2固定フレームワーク領域とマルチ解像度コンテキストを条件付けに用いることは、CDR生成の品質と構造的リアリズムを改善するか。
RQ3モデルは抗原結合やSARS-CoV-2中和予測といった特性指向の成果を改善できるか。
RQ4反復的洗練は抗体の自己回帰的グラフ生成で生じる誤差の連鎖を減らすことができるか。

主な発見

モデル	CDR-H1 PPL	CDR-H1 RMSD	CDR-H2 PPL	CDR-H2 RMSD	CDR-H3 PPL	CDR-H3 RMSD	AAR
LSTM	6.79	-	7.21	-	9.70	-	22.53%
AR-GNN	6.44	2.97	6.86	2.27	9.44	3.63	23.86%
RefineGNN	6.09	1.18	6.58	0.87	8.38	2.50	35.37%
RAbD	-	-	-	-	-	-	28.53%

RefineGNNはCDR-H1/H2/H3でLSTMおよびAR-GNNより低い perplexity を達成（CDR-H3 perplexity: 8.38 for RefineGNN vs 9.70 LSTM and 9.44 AR-GNN）。
RefineGNNはCDR-H3構造予測の RMSD を大幅に低減（CDR-H1 1.18 Å, CDR-H2 0.87 Å, CDR-H3 2.50 Å、AR-GNNのそれぞれは 2.97, 2.27, 3.63）。
抗原結合設計でRefineGNNは最高のアミノ酸回復率（AAR）35.37%を達成、21.53%（LSTM）と23.86%（AR-GNN）を上回る。
SARS-CoV-2中和最適化では、ITAファインチューニング後の平均中和スコアが75.2%で、LSTM（72.0%）およびAR-GNN（70.4%）を上回る。
SAbDabで事前学習しCoVAbDabでITAでファインチューニングしたRefineGNNは、ベースラインより良い perplexity（7.86）と高い中和スコアを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。