Skip to main content
QUICK REVIEW

[論文レビュー] Recent advances in artificial intelligence for retrosynthesis

Zipeng Zhong, Jie Song|arXiv (Cornell University)|Jan 14, 2023
Machine Learning in Materials Science被引用数 9
ひとこと要約

AI駆動の単一步サージと多步サージ法の総合レビュー、分類、評価、データセット、プラットフォーム、将来の方向性についての議論。

ABSTRACT

Retrosynthesis is the cornerstone of organic chemistry, providing chemists in material and drug manufacturing access to poorly available and brand-new molecules. Conventional rule-based or expert-based computer-aided synthesis has obvious limitations, such as high labor costs and limited search space. In recent years, dramatic breakthroughs driven by artificial intelligence have revolutionized retrosynthesis. Here we aim to present a comprehensive review of recent advances in AI-based retrosynthesis. For single-step and multi-step retrosynthesis both, we first list their goal and provide a thorough taxonomy of existing methods. Afterwards, we analyze these methods in terms of their mechanism and performance, and introduce popular evaluation metrics for them, in which we also provide a detailed comparison among representative methods on several public datasets. In the next part we introduce popular databases and established platforms for retrosynthesis. Finally, this review concludes with a discussion about promising research directions in this field.

研究の動機と目的

  • AIベースの retrosynthesis 手法の Goals と taxonomy(単一步と多步)を概説する。
  • 代表的な手法の仕組み、性能、評価指標を分析する。
  • retrosynthesis 研究で用いられるデータセット、データベース、プラットフォームを要約する。
  • 制約を論じ、将来の有望な研究方向を提案する。

提案手法

  • 単一步 retrosynthesis 手法の分類(選択ベースと生成ベース)を提供する。
  • テンプレートベース生成とテンプレートレス生成のアプローチとそのサブカテゴリ(反応物/テンプレート選択、半テンプレ生成、完全生成モデル)を説明する。
  • モデルアーキテクチャ(GNN、Transformers、MPNN、LSTM)とデータ拡張戦略を議論する。
  • 評価指標をレビューし、公開データセット上で代表的手法を比較する。
  • retrosynthesis のデータベースとプラットフォームを紹介し、将来の方向性を概説する。

実験結果

リサーチクエスチョン

  • RQ1単一步および多步 retrosynthesis に対する主要なAI駆動アプローチは何か。
  • RQ2選択ベース、テンプレートベース、半テンプレ、テンプレートフリーの方法は仕組みと性能でどう比較されるか。
  • RQ3 retrosynthesis 手法をベンチマークする評価指標とデータセットは何か、代表的手法はこれらのベンチマークでどう評価されているか。
  • RQ4AIベースの retrosynthesis を支えるデータベースとプラットフォームは何か、将来の方向性で最も有望なものは何か。

主な発見

  • 単一步 retrosynthesis 手法は選択ベース(反応物またはテンプレート選択)と生成ベース(半テンプレとテンプレートフリー)に分類される。
  • テンプレートベースの手法は反応テンプレートを活用し、データ拡張とテンプレート取得を用いて希少またはゼロショットのテンプレートを扱える。
  • 半テンプレ生成(P2S および S2R)とテンプレートフリー生成(完全エンドツーエンド)は、グラフベースおよび SMILES ベースの表現を用いる核となるアプローチであり、いくつかの研究は Transformer アーキテクチャとデータ拡張を活用して精度と妥当性を向上させている。
  • 初期のニューラルテンプレート手法(例:NeuralSym)は強力な結果を示したが、解釈性と表現力の制約に直面し、LocalRetro のようなグラフベースおよびローカルテンプレートアプローチへ移行した。
  • 前方予測とサイクル整合性の概念(前方検証、Cycle Consistency)は retrosynthesis の予測精度と反応物候補の多様性を向上させるために用いられてきた。
  • SMILES 表現のデータ拡張とテスト時の SMILES 変異は、一般化能力を大幅に向上させ、無効予測を減らした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。