[論文レビュー] PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion
PepTuneは、結合性、透過性、溶解性を含む複数の治療特性を最適化し、有効で多様なペプチドSMILESを生成するための、モンテカルロ木探索ガイダンス付きの多目的離散拡散フレームワークを導入します。
We present PepTune, a multi-objective discrete diffusion model for simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with a novel bond-dependent masking schedule and invalid loss function. To guide the diffusion process, we introduce Monte Carlo Tree Guidance (MCTG), an inference-time multi-objective guidance algorithm that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTG integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity. Using PepTune, we generate diverse, chemically-modified peptides simultaneously optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling for various disease-relevant targets. In total, our results demonstrate that MCTG for masked discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.
研究の動機と目的
- 複数の対立する治療目的を満たすペプチド設計の課題を動機づける。
- 非天然アミノ酸と環状構造を含むことができる、ペプチド SMILES の離散拡散ベースの生成モデルを開発する。
- 複数の性質を最適化するための、モンテカルロ木探索に基づく多目的ガイダンスフレームワークを導入する。
- 目的ガイダンスを支援するための、ペプチド SMILES の性質予測モデルを提供する。
- 標的タンパク質に対する結合性と透過性の改善を示すケーススタディを実証する。
提案手法
- RoFormer バックボーンを用いたマスク付き拡散言語モデル PepMDLM を構築し、ペプチド結合を強制する結合依存のマスキングを用いてペプチド SMILES を生成する。
- 生成過程の早い段階でペプチド結合を展開することを優先する、結合依存マスキングスケジュールを導入する。
- 無効なペプチド構造を罰するグローバルな無効 SMILES 損失を追加し、罰則をトークン確率でスケールする。
- Gumbel ベースのアンマスキングを用いたモンテカルロ木探索を用いて配列を探索・展開し、複数の目的を横断してパレート最適なペプチドを生成する。
- ペプチド SMILES を用いた回帰・分類モデルを訓練し、結合親和性と膜透過性を予測し、溶解性、溶血性、非付着性の分類器を構築する。
- TfR、GLP-1R、GFAP、NCAM1、AMHR2 を含む標的でケーススタディを実施し、多目的ペプチド設計とドッキング検証を示す。
実験結果
リサーチクエスチョン
- RQ1離散拡散モデルは非天然アミノ酸と環状構造を含む有効で化学的に修飾されたペプチド SMILES を生成できるか?
- RQ2MCTS による多目的ガイダンスは結合親和性、透過性、溶解性、非付着性、溶血性を均衡させるパレート最適なペプチド配列を生み出せるか?
- RQ3ペプチド SMILES ベースの性質予測モデルは、治療ターゲットに対して生成を導くのに十分正確か?
- RQ4PepTune 生成ペプチドは、既知の結合体と比較して臨床的に関連するターゲットに対して競合的なドッキングと結合を示すか?
- RQ5このアプローチは膜結合受容体や細胞内タンパク質を含む多様なターゲットに対して一般化可能か?
主な発見
- PepMDLMは、約15アミノ酸の長さで有効なペプチド生成率を45%、約30アミノ酸で36%を実現した(フィルタリング後)。
- PepTuneはMCTSガイド生成で20回の反復以内に100%の有効性を達成し、無条件モデルと同程度の多様性と独自性を維持した。
- PepTune条件付きペプチドは無条件サンプルより結合性予測分布が高く、TfRやGLP-1Rなどの標的に対して競合的なスコアでドッキングする。
- TfRに対して、PepTuneは-6.0 kcal/mol以下のドッキング結合体を生み出し、トップは-8.4 kcal/molで、既知の結合体T7に匹敵。
- GLP-1R条件付きペプチドは-7.4および-7.0 kcal/molのドッキングスコアを達成し、一部の既存GLP-1R作動薬をドッキング文脈で上回る。
- GFAP細胞内標的には、-7 kcal/mol以下のドッキングスコアを示す結合体が得られ、潜在的な細胞内作用を支持。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。