Skip to main content
QUICK REVIEW

[논문 리뷰] Uni-Mol Docking V2: Towards Realistic and Accurate Binding Pose Prediction

Eric Alcaide, Zhifeng Gao|arXiv (Cornell University)|2024. 05. 20.
Advanced Surface Polishing Techniques인용 수 6
한 줄 요약

Uni-Mol Docking V2는 PoseBusters에서 결합 포즈 예측에서 최첨단 성능을 달성했으며, 77.6% <2.0 Å RMSD 및 95.29% Astex 타당성으로 과거 ML 도킹의 화학적 부정확성을 해결합니다.

ABSTRACT

In recent years, machine learning (ML) methods have emerged as promising alternatives for molecular docking, offering the potential for high accuracy without incurring prohibitive computational costs. However, recent studies have indicated that these ML models may overfit to quantitative metrics while neglecting the physical constraints inherent in the problem. In this work, we present Uni-Mol Docking V2, which demonstrates a remarkable improvement in performance, accurately predicting the binding poses of 77+% of ligands in the PoseBusters benchmark with an RMSD value of less than 2.0 Å, and 75+% passing all quality checks. This represents a significant increase from the 62% achieved by the previous Uni-Mol Docking model. Notably, our Uni-Mol Docking approach generates chemically accurate predictions, circumventing issues such as chirality inversions and steric clashes that have plagued previous ML models. Furthermore, we observe enhanced performance in terms of high-quality predictions (RMSD values of less than 1.0 Å and 1.5 Å) and physical soundness when Uni-Mol Docking is combined with more physics-based methods like Uni-Dock. Our results represent a significant advancement in the application of artificial intelligence for scientific research, adopting a holistic approach to ligand docking that is well-suited for industrial applications in virtual screening and drug design. The code, data and service for Uni-Mol Docking are publicly available for use and further development in https://github.com/dptech-corp/Uni-Mol.

연구 동기 및 목표

  • ML 도킹 방법의 물리적 타당성과 화학적 정확성 문제 해결.
  • unseen 단백질–리간드 복합체에 대한 PoseBusters 벤치마크 성능 개선.
  • 공개 가능한 코드와 데이터로 재현 가능한 데이터 처리 및 도킹 파이프라인 제공.
  • 물리 기반 도킹과의 통합 가능성 시연을 통해 산업용 가상 스크리닝에의 적용성 확인

제안 방법

  • Uni-Mol 프레임워크에서 분자 및 포켓 인코더를 사전 학습하여 도킹 모델 초기화.
  • 단백질 데이터에 수소 추가, 양성자화 정보 및 완전한 무거운 원자/잔기를 포함하도록 준비.
  • 8 V100 GPU에서 100 에포크 동안 MOAD 유래 데이터로 9:1 학습/검증 분할로 도커를 학습.
  • 리간트에 대해 10 Å 여유를 가진 포켓 구제를 포함하는 입방형 영역을 기반으로 한 포켓 구성.
  • 효율성을 위한 포켓 특성은 미리 계산된 입력으로 포켓 플러스 리간드 구성체를 입력하고 3D 리간드 포즈를 출력하며
  • 정확도 향상을 위해 물리 기반 Uni-Dock를 결합한 Uni-Mol Docking으로 보조 인자(cofactors) 및 물을 반영합니다.

실험 결과

연구 질문

  • RQ1PoseBusters에서 키리얼리 변환이나 입체 충돌 없이 ML 기반 도킹이 화학적으로 타당한 포즈를 달성할 수 있는가?
  • RQ2재현 가능한 데이터 처리 및 입력 생성이 PoseBusters 및 Astex 벤치마크 성능에 미치는 영향은 무엇인가?
  • RQ3물리 기반 도킹(Uni-Dock)과의 통합이 더 높은 품질의 물리적으로 타당한 예측을 가져오는가?
  • RQ4기존 ML 도킹 모델에 비해 언노운 데이터에서 Uni-Mol Docking V2의 성능은 어떠한가?
  • RQ5PoseBusters 대상의 생화학적 공간 커버리지와 V2가 다양한 단백질-리간드 복합체를 어떻게 다루는가?

주요 결과

  • Uni-Mol Docking V2는 PoseBusters에서 RMSD <2.0 Å인 리간드의 77.6% 및 Astex에서 95.29%를 달성하여 이전 오픈 소스 모델을 능가합니다.
  • PoseBusters 복합체의 75% 이상이 모든 품질 검사에 합격합니다.
  • Uni-Mol Docking V2는 입체화 반전이나 공간 충돌이 관찰되지 않는 화학적으로 정확한 예측을 생성합니다.
  • Uni-Dock과 결합할 때 고품질 예측(RMSD <1.0 Å 및 <1.5 Å)이 개선되고 물리적 타당성은 여전히 높습니다(>95%).
  • 표준화된 데이터 처리 파이프라인과 공개 코드로 재현 가능한 결과를 얻고 다른 도킹 방법과의 공개 비교가 가능합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.