Skip to main content
QUICK REVIEW

[論文レビュー] ASKCOS: an open source software suite for synthesis planning

Zhengkai Tu, Sourabh J. Choure|arXiv (Cornell University)|Jan 3, 2025
Manufacturing Process and Optimization被引用数 6
ひとこと要約

ASKCOSは、対話的逆合成計画、自動多段ツリー探索、および条件・成果・溶解度・QM記述子などのさまざまな予測モジュールを組み合わせ、複数のワンステップモデルとユーザーのカスタマイズをサポートするデータ駆動型合成計画のオープンソースソフトウェアスイートです。

ABSTRACT

The advancement of machine learning and the availability of large-scale reaction datasets have accelerated the development of data-driven models for computer-aided synthesis planning (CASP) in the past decade. Here, we detail the newest version of ASKCOS, an open source software suite for synthesis planning that makes available several research advances in a freely available, practical tool. Four one-step retrosynthesis models form the basis of both interactive planning and automatic planning modes. Retrosynthetic planning is complemented by other modules for feasibility assessment and pathway evaluation, including reaction condition recommendation, reaction outcome prediction, and auxiliary capabilities such as solubility prediction and quantum mechanical descriptor prediction. ASKCOS has assisted hundreds of medicinal, synthetic, and process chemists in their day-to-day tasks, complementing expert decision making. It is our belief that CASP tools like ASKCOS are an important part of modern chemistry research, and that they offer ever-increasing utility and accessibility.

研究の動機と目的

  • 複数のワンステップ逆合成モデルを統合したモジュラーCASPツールを提供することで、アクセス可能な合成計画を促進する。
  • 対話的計画(IPP)と自動木探索(Tree Builder)の両方を有効にして、合成ルートを生成する。
  • ルート評価と意思決定を支援する補助的予測モジュール(反応条件、反応成果、溶解度、QM記述子)を提供する。

提案手法

  • 対話的経路計画(IPP)と自動多段計画のためのTree Builderの2つの逆合成モードを開発する。
  • Transformer、Graph2SMILES、Retrosim、テンプレート関連性手法を含む、テンプレートベースおよびテンプレートフリーの複数のワンステップ逆合成モデルを組み込む。
  • 高速な妥当性フィルタリングと前提購買性/複雑さに基づく前駆体のランキングを実装する。クラスター化、原子マッピング、選択性チェックを有効にする。
  • 複数モデルを組み合わせて推奨を統合し、信頼度推定を改善できるようにする。
  • 反応条件推奨、前方反応予測、不純物/位相選択性予測、溶解度およびQM記述子予測のモジュールを提供する。
  • モンテカルロ木探索(MCTS)やRetro*などの探索アルゴリズムを自動計画に利用し、ユーザー主導およびファイアウォール内部展開を可能にする。

実験結果

リサーチクエスチョン

  • RQ1オープンソースのCASPツールは、実務家にとっての使いやすさを保ちつつ、逆合成、条件予測、成果予測の広さをどのように提供できるか。
  • RQ2統一ツールに組み込んだ場合、標準ベンチマークに対する様々なワンステップ逆合成モデル(テンプレートベース・テンプレートフリー)の性能はどうなるか。
  • RQ3複数の予測モデルを組み合わせて、逆合成計画の信頼性と有用性をどのように向上させるか。
  • RQ4オープンソースのCASPソフトウェアにおけるマルチステップ計画(MCTS、Retro*、木探索)の効果的な戦略は何か。
  • RQ5補助的予測子(溶解度、QM記述子)が合成計画の実務的意思決定をどのように高めるか。

主な発見

モデル名タイプUSPTO-50k Top 1USPTO-50k Top 10出典USPTO-full Top 1USPTO-full Top 10出典
テンプレート関連性テンプレートベース45.283.5[74]35.860.8[13]
Retrosimテンプレートベース37.374.1[15]32.856.1[13]
Transformer w/o aug.テンプレートフリー43.178.7[72]42.966.8[75]
Transformer w/ aug.テンプレートフリー53.285.2[18]44.473.3[18]
Graph2SMILESテンプレートフリー52.979.5[17]45.763.4[17]
  • ASKCOSは4つのワンステップ逆合成モデル(テンプレートベースおよびテンプレートフリー)をサポートし、それらをSTRATEGY SETTINGS内でアンサンブルとして利用できる。
  • 対話型計画モード(IPP)は、モデル由来のメタデータとフィルタリングオプションを備えた、ターゲット、前駆体、反応ノードの化学情報を表示する視覚化を提供する。
  • Tree Builderによる自動のマルチステップ計画は、MCTSまたはRetro*を用いて合成経路を生成し、深さ、分岐、時間設定で調整可能である。
  • 反応条件推薦、反応成果予測、不純物・位相選択性分析、溶解度およびQM記述子予測など、提案ルートを評価・制約するための幅広いモジュールが利用可能である。
  • 論文で報告されているベンチマークは、USPTO-50kおよびUSPTO-fullデータセットに対する複数モデルのトップk精度を示し、テンプレートベースとテンプレートフリーのアプローチ間でさまざまな強みを示している。
  • オープンソースでモジュラーな設計はファイアウォールの背後でのデプロイと proprietaryデータのカスタマイズを可能にし、産業界と学術界での実用的な適用を促進する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。