Skip to main content
QUICK REVIEW

[論文レビュー] TorchDrug: A Powerful and Flexible Machine Learning Platform for Drug Discovery

Zhaocheng Zhu, Chence Shi|arXiv (Cornell University)|Feb 16, 2022
Computational Drug Discovery Methods被引用数 31
ひとこと要約

TorchDrugは、速度に優れたプロトタイプ作成を可能にする、性質予測、事前学習表現、デノボ設計、リトロセンス、そして生物医薬知識グラフ推論の分野で、低・中・高レベルのツールを提供するオープンソースの PyTorch ベースプラットフォームです。

ABSTRACT

Machine learning has huge potential to revolutionize the field of drug discovery and is attracting increasing attention in recent years. However, lacking domain knowledge (e.g., which tasks to work on), standard benchmarks and data preprocessing pipelines are the main obstacles for machine learning researchers to work in this domain. To facilitate the progress of machine learning for drug discovery, we develop TorchDrug, a powerful and flexible machine learning platform for drug discovery built on top of PyTorch. TorchDrug benchmarks a variety of important tasks in drug discovery, including molecular property prediction, pretrained molecular representations, de novo molecular design and optimization, retrosynthsis prediction, and biomedical knowledge graph reasoning. State-of-the-art techniques based on geometric deep learning (or graph machine learning), deep generative models, reinforcement learning and knowledge graph reasoning are implemented for these tasks. TorchDrug features a hierarchical interface that facilitates customization from both novices and experts in this domain. Tutorials, benchmark results and documentation are available at https://torchdrug.ai. Code is released under Apache License 2.0.

研究の動機と目的

  • 知識ギャップと標準的なベンチマークの不足により、創薬における柔軟な ML プラットフォームの必要性を喚起する。
  • 初心者の敷居を下げつつ、専門家のカスタマイズを可能にする階層的なインターフェースを提供する。
  • 創薬の主要な課題における実験を加速させる包括的なタスクとベンチマークを提供する。
  • 再利用可能なコンポーネント(データ構造、レイヤー、モデル)とタスクレベルのルーチンを提示し、開発を円滑化する。

提案手法

  • 同質グラフ、知識グラフ、分子をファーストクラスのデータ構造として導入し、GPU 加速されたグラフ演算を提供する。
  • PyTorch に似た Dataset インターフェースを提供し、創薬の5つのタスクにまたがる30のデータセットを含む。
  • データ処理、モデル構築、タスク実行のための低・中・高レベルの API を提供する。
  • TorchDrug 内でグラフ学習、深層生成モデル、強化学習、知識グラフ推論の最先端技術を実装する。
  • 異なる専門知識レベルの研究者を対象に、迅速なプロトタイピングとカスタマイズをサポートする階層的インターフェースを説明する。

実験結果

リサーチクエスチョン

  • RQ1統一されたモジュール式プラットフォームは、複数のタスクにまたがる創薬における機械学習研究をどのように加速できるか。
  • RQ2効果的なベンチマークと迅速なプロトタイピングを実現するために、どのデータセット、モデル、タスクを束ねるべきか。
  • RQ3TorchDrugは標準の PyTorch ワークフローと統合する、GPU 加速のドメイン非依存グラフ演算を提供できるか。
  • RQ4階層的な API 設計が初心者の使いやすさと専門家の柔軟性に与える影響は何か。

主な発見

  • TorchDrug は GPU 加速演算と PyTorch スタイルのインターフェースを備えたデータ構造(グラフ、知識グラフ、分子)を提供する。
  • datasets モジュールは、創薬の5つのタスクをカバーする30の一般的なデータセットを含む。
  • TorchDrug は、性質予測、事前学習済み分子表現、デノボ分子設計と最適化、リトロセンス、そして 生物医薬知識グラフ推論など、幅広いタスクをサポートする。
  • そのエコシステム内で、幾何学的深層学習、深層生成モデル、強化学習、知識グラフ推論といった最先端技術をブランディングしている。
  • TorchDrugは、2021年8月のリリース以来、PyPIと Anaconda で5,000件を超えるダウンロードという顕著な普及を達成している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。