Skip to main content
QUICK REVIEW

[논문 리뷰] Minimal-Action Discrete Schrödinger Bridge Matching for Peptide Sequence Design

Shrey Goel, Pranam Chatterjee|arXiv (Cornell University)|2026. 01. 29.
DNA and Biological Computing인용 수 0
한 줄 요약

MadSBM은 생물학적으로 정보를 반영한 기준 프로세스와 학습된 제어를 사용하여 속도 기반의 이산 슈뢰딩거 다리를 펩타이드 설계에 도입하고, 고가능도 서열을 효율적으로 생성한다.

ABSTRACT

Generative modeling of peptide sequences requires navigating a discrete and highly constrained space in which many intermediate states are chemically implausible or unstable. Existing discrete diffusion and flow-based methods rely on reversing fixed corruption processes or following prescribed probability paths, which can force generation through low-likelihood regions and require countless sampling steps. We introduce Minimal-action discrete Schrödinger Bridge Matching (MadSBM), a rate-based generative framework for peptide design that formulates generation as a controlled continuous-time Markov process on the amino-acid edit graph. To yield probability trajectories that remain near high-likelihood sequence neighborhoods throughout generation, MadSBM 1) defines generation relative to a biologically informed reference process derived from pre-trained protein language model logits and 2) learns a time-dependent control field that biases transition rates to produce low-action transport paths from a masked prior to the data distribution. We finally introduce guidance to the MadSBM sampling procedure towards a specific functional objective, expanding the design space of therapeutic peptides; to our knowledge, this represents the first-ever application of discrete classifier guidance to Schrödinger bridge-based generative models.

연구 동기 및 목표

  • 펩타이드 서열 생성을 소음이 있는 사전 분포와 아미노산 편집 그래프의 데이터 분포 사이의 최소 작용 전달로 재정의한다.
  • 사전 학습된 단백질 언어 모델 로짓에서 얻은 생물학적으로 정보를 갖춘 기준 프로세스를 활용하여 생성을 유도한다.
  • 고가능도 펩타이드 이웃으로의 전이 비율을 기울이기 위한 시간 의존 제어 필드를 학습한다.
  • 목표 지향 샘플링을 활성화하여 기능적 설계 목표를 반영한다.
  • 가이드 디자인을 가능하게 하면서 이산 확산 기준선과 비교한 샘플 효율성과 안정성을 입증한다.

제안 방법

  • 참조 생성기 R0를 갖는 아미노산 편집 그래프 상의 제어된 연속 시간 마르코프 체인(CTMC)으로 생성을 모델링한다.
  • R_u(x,x') = R0(x,x') exp(u_theta(x,x',t))를 정의하여 비스듬하고 시간 의존적인 제어 프로세스를 생성한다.
  • Ψ(z)=e^z - z - 1인 가역 가능한 작용 함수 A(u) = E_{P_u}[ ∫ R0(X_t,x') Ψ(u(X_t,x',t)) dt ]를 도출한다.
  • 교차 엔트로피 목표를 사용하여 대상 서열로의 전이와 일치하도록 신경 제어 필드 u_theta를 학습한다(식 10).
  • 참조 프로세스로 ESM-2 로짓을 사용하고 마스킹 전체에서 참조의 영향을 조절하는 시간 게이팅 메커니즘을 적용한다.
  • 샘플링은 학습된 생성기 R_theta로 CTMC를 시뮬레이션하여 완전히 마스킹된 사전으로부터 N단계로 이산화하는 방식으로 진행된다.
Figure 1: Overview of MadSBM . We leverage a principled reference process $R_{0}$ so the MadSBM model requires only a lightweight time-conditioned control field $u_{\theta}$ to steer samples toward high-likelihood regions of the sequence space.
Figure 1: Overview of MadSBM . We leverage a principled reference process $R_{0}$ so the MadSBM model requires only a lightweight time-conditioned control field $u_{\theta}$ to steer samples toward high-likelihood regions of the sequence space.

실험 결과

연구 질문

  • RQ1생물학적으로 정보를 반영한 기준 프로세스를 사용하여 디노보(discrete) 펩타이드 공간에서 이산 슈뢰딩거 다리를 해결할 수 있는가?
  • RQ2최소 작용 목표하에서 시간 의존 제어 필드를 학습하는 것이 이산 확산 기준선과 비교하여 효율적이고 고품질의 펩타이드 생성을 유도하는가?
  • RQ3목표 지향 샘플링(예: 결합 친화도)을 이산 슈뢰딩거 다리 샘플링에 통합하여 기능적 설계 품질을 향상시킬 수 있는가?

주요 결과

N모델PPL (낮을수록 좋음)pLDDT (높을수록 좋음)
32DD10.990 ± 6.76671.608 ± 9.692
32MadSBM8.389 ± 10.87371.687 ± 11.835
64DD9.042 ± 4.67973.848 ± 9.436
64MadSBM8.943 ± 15.38471.604 ± 12.223
128DD7.617 ± 6.83475.784 ± 8.787
128MadSBM8.719 ± 12.92570.725 ± 12.041
  • MadSBM은 샘플링 예산에 관계없이 이산 확산 기준선보다 경쟁력 있거나 더 나은 무조건적 서열 품질(PPL이 낮음)을 보이고, plausible pLDDT 점수를 보인다.
  • 무조건적 결과에서 MadSBM PPL은: 8.389, 8.943, 8.719이고 DD PPL은: 10.990, 9.042, 7.617로 N=32, 64, 128일 때(낮을수록 좋음)이다.
  • MadSBM은 샘플링 도중 확률 경로 다양성이 더 넓어 DD 기준선보다 더 이른 시점에 더 높은 가능도 영역으로 수렴하는 경향을 보인다.
  • 생물학적으로 정보를 반영한 기준(ESM-2)과 시간 게이팅의 제거는 퍼플렉시티를 저하시켜 기준 역학 설계를 검증한다.
  • 결합 친화도 예측기를 이용한 목표 지향 샘플링은 무조건적 생성보다 여러 표적에 대해 친화도와 도킹 점수를 향상시킨다.
Figure 2: Probability paths taken by models under various sampling budgets $(N)$ . The y-axis represents the NLL of the sequence at the current iteration, assessed by the ESM-2-650M protein language model. The shaded area around the traced trajectory represents the standard deviation of the NLL at t
Figure 2: Probability paths taken by models under various sampling budgets $(N)$ . The y-axis represents the NLL of the sequence at the current iteration, assessed by the ESM-2-650M protein language model. The shaded area around the traced trajectory represents the standard deviation of the NLL at t

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.