[논문 리뷰] Multi-Objective De Novo Drug Design with Conditional Graph Generative Model
이 논문은 원자 수준의 순환 단위를 사용하지 않고 순차적 그래프 생성 프레임워크를 활용하여 유효하고 복잡한 분자 구조를 효율적으로 생성하는 조건부 그래프 생성 모델을 제안한다. 이 모델은 유효성에서 SMILES 기반 모델을 능가하며, 특정 스caffolds, 약물 유사성, 합성 가능성, JNK3 및 GSK3β의 이중 억제와 같은 원하는 성질을 가진 분자를 생성할 때 높은 풍부도를 달성한다.
Recently, deep generative models have revealed itself as a promising way of performing de novo molecule design. However, previous research has focused mainly on generating SMILES strings instead of molecular graphs. Although current graph generative models are available, they are often too general and computationally expensive, which restricts their application to molecules with small sizes. In this work, a new de novo molecular design framework is proposed based on a type sequential graph generators that do not use atom level recurrent units. Compared with previous graph generative models, the proposed method is much more tuned for molecule generation and have been scaled up to cover significantly larger molecules in the ChEMBL database. It is shown that the graph-based model outperforms SMILES based models in a variety of metrics, especially in the rate of valid outputs. For the application of drug design tasks, conditional graph generative model is employed. This method offers higher flexibility compared to previous fine-tuning based approach and is suitable for generation based on multiple objectives. This approach is applied to solve several drug design problems, including the generation of compounds containing a given scaffold, generation of compounds with specific drug-likeness and synthetic accessibility requirements, as well as generating dual inhibitors against JNK3 and GSK3$β$. Results show high enrichment rates for outputs satisfying the given requirements.
연구 동기 및 목표
- de novo 약물 설계에서 SMILES 기반 생성의 한계를 해결하기 위해 원자 수준의 순환 단위에 의존하지 않는 분자 그래프 생성으로 전환한다.
- 기존 그래프 모델의 계산적 병목 현상을 극복하고 더 큰 분자에 대응할 수 있도록 확장 가능하고 효율적인 그래프 생성 모델을 개발한다.
- 다양한 화학적 및 약리학적 제약 조건에 기반한 탄력적이고 다목적의 분자 생성을 가능하게 한다.
- 시퀀스 기반 접근 방식에 비해 생성된 분자의 유효성과 화학적 관련성을 향상시킨다.
- 실제 약물 설계 작업, 특히 스caffolds 기반 및 이중 표적 억제제 생성에서의 방법의 효과성을 입증한다.
제안 방법
- 모델는 원자 수준의 순환 단위에 의존하지 않고 원자 단위로 분자를 구축하는 순차적 그래프 생성기를 사용하여 학습 효율성과 확장성을 향상시킨다.
- 특정 목표, 예를 들어 스caffolds 포함 또는 원하는 물리화학적 성질 기반으로 생성을 유도하기 위해 조건부 변동 자동인코더 프레임워크를 사용한다.
- ChEMBL 데이터베이스의 분자 그래프에서 엔드 투 엔드로 학습하여 큰 복잡한 분자를 생성할 수 있도록 한다.
- 잠재 공간 조건화를 통해 조건부 제어를 구현하여, 다양한 목적으로 유연하고 미세조정 없이도 생성이 가능하도록 한다.
- 무조건적 및 조건부 생성을 모두 지원하며, 목표 성질의 학습된 잠재 표현에 의해 추론이 유도된다.
- 유효한 그래프 생성을 위해 미분 가능한 그래프 생성 과정을 통해 유효하지 않은 출력의 수를 최소화한다.
실험 결과
연구 질문
- RQ1그래프 기반 생성 모델은 SMILES 기반 모델에 비해 화학적으로 유효하고 다양한 분자 구조를 더 잘 생성할 수 있는가?
- RQ2조건부 그래프 생성 모델은 특정 스caffolds와 약물 유사성과 같은 다수의 원하는 목표를 효과적으로 충족시키는 분자를 생성할 수 있는가?
- RQ3ChEMBL와 같은 실제 약물 데이터베이스에서 발견되는 더 큰 복잡한 분자에 대해 모델은 얼마나 잘 스케일링되는가?
- RQ4JNK3 및 GSK3β와 같은 두 가지 관련 약물 표적에 대한 이중 억제제를 생성할 수 있으며, 높은 풍부도를 달성할 수 있는가?
- RQ5다양한 목적으로의 약물 설계에서, 미세조정 기반 방법에 비해 조건부 생성 접근 방식은 더 큰 탄력성을 제공하는가?
주요 결과
- 그래프 기반 모델은 SMILES 기반 베이스라인 대비 생성된 분자에서 유의미하게 높은 유효성 비율을 달성하여 구조적 정밀도가 뛰어나다는 것을 입증했다.
- 모델은 목표 스caffolds, 약물 유사성, 합성 가능성에 대해 높은 풍부도를 달성한 분자를 성공적으로 생성하여 다목적 설계에서의 효과성을 확인했다.
- JNK3 및 GSK3β에 대한 이중 억제제 생성에 있어 높은 풍부도 비율을 달성하여 다약물 작용 약물 발견 잠재력이 높다는 것을 시사했다.
- 모델는 ChEMBL 데이터베이스에서 기존에 많은 그래프 생성 모델이 다루지 못했던 큰 분자에 대해서도 효과적으로 스케일링되었다.
- 잠재 공간 조건화를 통한 조건부 생성은 다양한 목적으로의 성능과 탄력성에서 미세조정 기반 접근 방식을 능가했다.
- 원자 수준의 순환을 포함하지 않아 복잡한 분자 그래프에 대해서도 높은 생성 효율성과 화학적 유효성을 유지했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.