[논문 리뷰] Learning to Extend Molecular Scaffolds with Structural Motifs
MoLeR는 골격 기반 생성과 조각/모티프 기반 구성을 지원하는 그래프 기반 분자 생성기로, 골격 제약 과제에서 최첨단 성능을 달성하면서 기준 모델보다 학습 및 샘플링 속도가 빠릅니다. 원자 단위(atom-by-atom) 생성과 모티프 기반 생성을 골격 의식적 해독 과정과 VAE 학습 체계와 결합합니다.
Recent advancements in deep learning-based modeling of molecules promise to accelerate in silico drug discovery. A plethora of generative models is available, building molecules either atom-by-atom and bond-by-bond or fragment-by-fragment. However, many drug discovery projects require a fixed scaffold to be present in the generated molecule, and incorporating that constraint has only recently been explored. Here, we propose MoLeR, a graph-based model that naturally supports scaffolds as initial seed of the generative procedure, which is possible because it is not conditioned on the generation history. Our experiments show that MoLeR performs comparably to state-of-the-art methods on unconstrained molecular optimization tasks, and outperforms them on scaffold-based tasks, while being an order of magnitude faster to train and sample from than existing approaches. Furthermore, we show the influence of a number of seemingly minor design choices on the overall performance.
연구 동기 및 목표
- 약물 발견에서 골격-제약 분자 생성의 필요성 동기 부여.
- 부분 분자를 모티프와 원자 단위 단계로 확장할 수 있는 그래프 기반 생성 모델 제안.
- 다양한 잠재 공간을 학습하기 위해 변분 오토인코더(variational autoencoder) 프레임워크 내에서 MoLeR 학습.
- MoLeR의 무제한 생성 경쟁력과 탁월한 골격 제약 성능 시연.
- 성능에 영향을 주는 생성 순서 및 모티프 어휘 크기 같은 설계 선택 분석.
제안 방법
- 모티프가 데이터에서 학습되어 빌딩 블록으로 사용되는 모티프 보강 그래프로 분자를 표현.
- 비순환 결합 파손에서 유도된 모티프 어휘를 사용해 분자를 분해하고 원자에 모티프 임베딩을 주석으로 달음.
- 공유 그래프 신경망에 조건부로 원자/모티프, 부착 지점, 결합을 선택하는 세 네트워크 MoLeR 디코더로 디코드.
- KL 항을 가진 VAE로 학습하고 재구성 항은 생성 시퀀스를 주변화하며 특성 예측 보조 손실을 더함.
- 스캐폴드에서 시작하거나 처음부터 생성 가능하도록 하고 화학적 타당성을 보장하기 위해 원자가 검사 및 모티프 특화 부착 처리를 수행.
- 화학적으로 타당성을 보장하기 위해 가치 있는 시작점 없이도 생성 가능하도록 하고 모티프별 부착 처리와 타당성 체크를 포함.
실험 결과
연구 질문
- RQ1MoLeR가 골격이 있는/없는 훈련 분포와 일치하는 분자를 학습하도록 학습할 수 있는가?
- RQ2MoLeR가 골격 제약 과제에서 최첨단 기준선보다 더 좋은 성능을 보이나?
- RQ3생성 순서와 모티프 어휘 크기가 MoLeR의 성능에 어떤 영향을 미치나?
- RQ4MoLeR가 기존의 그래프 기반 분자 생성기보다 학습 및 샘플링 속도가 빠른가?
- RQ5MoLeR가 MSO와 같은 잠재 공간 최적화 방법과 결합될 때 골격 제약 최적화를 지원할 수 있는가?
주요 결과
- MoLeR는 무제한 분자 생성에서 최첨단 성능에 일치하고 골격 제약 작업에서 기준선을 능가한다.
- MoLeR는 비교 대상 그래프 기반 모델보다 학습 및 샘플링을 한 차례의 차이로 더 빠르게 수행한다.
- 더 큰 모티프 어휘가 생성 품질을 향상시키며 특히 골격 제약 생성에 유리하다.
- 확정적 생성 순서는 무제한 결과를 더 잘 내는 경향이 있고, 특정 무작위 순서는 골격 제약 설정에서 뛰어나다.
- MoLeR는 높은 유효성, 고유성, 신기성을 유지하며 MSO와의 최적화에서도 잘 작동한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.