[論文レビュー] Protein Design with Guided Discrete Diffusion
本論文は、シーケンス空間における離散拡散の勾配ベースサンプリング法 diffusioNOS を提案し、それを LaMBO-2 と組み合わせて多目的抗体設計を行い、探索的な in vitro 実験で高い発現と結合を達成する。
A popular approach to protein design is to combine a generative model with a discriminative model for conditional sampling. The generative model samples plausible sequences while the discriminative model guides a search for sequences with high fitness. Given its broad success in conditional sampling, classifier-guided diffusion modeling is a promising foundation for protein design, leading many to develop guided diffusion models for structure with inverse folding to recover sequences. In this work, we propose diffusioN Optimized Sampling (NOS), a guidance method for discrete diffusion models that follows gradients in the hidden states of the denoising network. NOS makes it possible to perform design directly in sequence space, circumventing significant limitations of structure-based methods, including scarce data and challenging inverse design. Moreover, we use NOS to generalize LaMBO, a Bayesian optimization procedure for sequence design that facilitates multiple objectives and edit-based constraints. The resulting method, LaMBO-2, enables discrete diffusions and stronger performance with limited edits through a novel application of saliency maps. We apply LaMBO-2 to a real-world protein design task, optimizing antibodies for higher expression yield and binding affinity to several therapeutic targets under locality and developability constraints, attaining a 99% expression rate and 40% binding rate in exploratory in vitro experiments.
研究の動機と目的
- 逆折り畳みに頼らず、離散的なシーケンス空間で効率的なタンパク質設計を推進する。
- シーケンスレベルの目的関数を最適化するための、勾配ガイド付き離散拡散サンプリング法(NOS)を開発する。
- NOS と顕性駆動型編集を組み込んだ LaMBO-2 を強化し、多目的抗体設計を実現する。
- 現実的な制約下で、抗体の発現量と結合の実用的な改善を実証する。
提案手法
- denoising ネットワークの隠れ状態における勾配を適用して離散拡散を導く NOS (diffusioN Optimized Sampling) を提案する。
- NOS を2つの変種で定式化する:NOS-C(連続潜在空間ガイダンス)と NOS-D(離散遷移ガイダンス)。
- 修正された遷移分布からサンプリングしつつ、シーケンス尤度を保つように、NOS を Langevin ダイナミクスと組み合わせる。
- NOS を LaMBO-2 に組み込み、MLMサンプラーを置換し、顕性マップを用いて編集位置を選択して多目的最適化を行う。
- 部分的な深層アンサンブルを用いて事後目的を推定し、多目的最適化の獲得関数を適用する。
- 影響力のある配列部位に編集を集中させるため、顕性ベースの編集位置選択を行う。
実験結果
リサーチクエスチョン
- RQ1タンパク質設計におけるガイド付き離散拡散で、シーケンス尤度と目的値のトレードオフを NOS が改善できるか?
- RQ2顕性駆動型編集位置選択は、抗体設計のベイズ最適化における効率と性能を高めるか?
- RQ3複数目的制約(発現量、結合)を伴う実世界の抗体リード最適化において、LaMBO-2 は in silico および in vitro でどのように性能を発揮するか?
主な発見
- NOS は、in silico の unguided および guided infilling タスクで、最先端の構造ベースおよび配列ベースのベースラインを上回る。
- NOS と顕性駆動編集を組み合わせた LaMBO-2 は、限られた編集でより強い性能と多目的最適化を可能にする。
- 抗体設計タスクでは、LaMBO-2 は遺伝的ベースラインよりも自然性制約をより良く維持しつつ、より高い獲得値サンプルを生み出す。
- LaMBO-2 を用いた抗体リード最適化は、4 つのターゲットで反復ラウンドの後、in vitro で複数のサブミクロン結合体を達成した。
- 探索的な in vitro 実験では、最適化された抗体の発現率 99%、結合率 40% を報告。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。