Skip to main content
QUICK REVIEW

[논문 리뷰] Optimizing Drug Design by Merging Generative AI With Active Learning Frameworks

Isaac Filella-Mercè, Alexis Molina|arXiv (Cornell University)|2023. 05. 04.
Computational Drug Discovery Methods인용 수 9
한 줄 요약

이 논문은 변분 오토인코더 기반의 생성 워크플로우를 능동 학습 및 분자 모델링과 통합하여 고 친화성, 합성 가능성 있는 약물 후보를 설계하며 CDK2와 KRAS에서 새로운 골격을 시연한다.

ABSTRACT

Traditional drug discovery programs are being transformed by the advent of machine learning methods. Among these, Generative AI methods (GM) have gained attention due to their ability to design new molecules and enhance specific properties of existing ones. However, current GM methods have limitations, such as low affinity towards the target, unknown ADME/PK properties, or the lack of synthetic tractability. To improve the applicability domain of GM methods, we have developed a workflow based on a variational autoencoder coupled with active learning steps. The designed GM workflow iteratively learns from molecular metrics, including drug likeliness, synthesizability, similarity, and docking scores. In addition, we also included a hierarchical set of criteria based on advanced molecular modeling simulations during a final selection step. We tested our GM workflow on two model systems, CDK2 and KRAS. In both cases, our model generated chemically viable molecules with a high predicted affinity toward the targets. Particularly, the proportion of high-affinity molecules inferred by our GM workflow was significantly greater than that in the training data. Notably, we also uncovered novel scaffolds significantly dissimilar to those known for each target. These results highlight the potential of our GM workflow to explore novel chemical space for specific targets, thereby opening up new possibilities for drug discovery endeavors.

연구 동기 및 목표

  • 새로운 분자를 설계하고 특성을 향상시키기 위해 Generative AI (GM) 방법의 활용을 촉진한다.
  • 표적 친화도, ADME/PK 격차, 및 합성 가능성 등의 GM 접근법의 한계를 다룬다.
  • 분자 지표로부터 반복적으로 학습하여 화학 공간을 확장하는 워크플로우를 개발한다.
  • 실용성과 신규성을 평가하기 위해 모델 타깃인 CDK2 및 KRAS에 워크플로우를 적용한다.

제안 방법

  • 핵심 생성 모델로 변분 오토인코더(VAE)를 사용한다.
  • 약물유사성, 합성 가능성, 유사성, 도킹 점수 등의 지표를 기반으로 설계를 반복적으로 정제하는 능동 학습 단계를 도입한다.
  • 고급 분자 모델링 시뮬레이션에 의해 안내되는 계층적 최종 선택 단계를 제시한다.
  • 표적에 대한 친화도와 합성 타당성을 평가한다.
  • 각 타깃에 대해 알려진 화학과 다르게 새로운 골격을 식별한다.

실험 결과

연구 질문

  • RQ1VAE 기반 GM 워크플로우가 CDK2 및 KRAS의 고 친화성 분자 비율을 학습 데이터 이상으로 향상시킬 수 있는가?
  • RQ2반복적 능동 학습과 다중 기준 평가가 합성 가능성이 있는 후보를 가진 화학 공간을 확장하는가?
  • RQ3각 타깃에서 알려진 리간드와 현저히 다른 새로운 골격이 발견되는가?

주요 결과

  • GM 워크플로우는 CDK2 및 KRAS에 대해 높은 예측 친화도를 가진 화학적으로 실행 가능한 분자를 생성했다.
  • GM 워크플로우에 의해 유추된 고 친화성 분자의 비율은 학습 데이터보다 컸다.
  • 이 접근법은 각 타깃에 대해 알려진 골격과 상당히 다른 새로운 골격을 발견했다.
  • 결과는 새로운 화학 공간을 탐색하고 타깃 중심의 약물 발견을 개선할 가능성을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.