Skip to main content
QUICK REVIEW

[論文レビュー] Chemical space exploration with molecular genes and machine learning

Bing Huang, O. Anatole von Lilienfeld|arXiv (Cornell University)|Jul 13, 2017
Machine Learning in Materials Science被引用数 4
ひとこと要約

本論文では、化学的空間を効率的に探索するため、原子の分子内状態(amons)と移譲可能な量子機械学習を組み合わせたAMLモデルを提案する。アクティブラーニングと局所的原子環境を活用することで、有機分子からタンパク質に至る多様な系において、高い精度とスケーラビリティを実現した量子性質の予測が可能となり、周期律表の概念を化学的環境に拡張した。

ABSTRACT

First principles based exploration of chemical space deepens our understanding of chemistry, and might help with the design of new materials or experiments. Due to the computational cost of quantum chemistry methods and the immens number of theoretically possible stable compounds comprehensive in-silico screening remains prohibitive. To overcome this challenge, we combine atoms-in-molecules based fragments, dubbed amons (A), with active learning in transferable quantum machine learning (ML) models. The efficiency, accuracy, scalability, and transferability of resulting AML models is demonstrated for important molecular quantum properties, such as energies, forces, atomic charges NMR shifts, polarizabilities, and for systems ranging from organic molecules over 2D materials and water clusters to Watson-Crick DNA base-pairs and even ubiquitin. Conceptually, the AML approach extends Mendeleev's table to effectively account for chemical environments, which allows the systematic reconstruction of many chemistries from local building blocks.

研究の動機と目的

  • 従来の量子化学的手法では計算的に非現実的である化学的空間の包括的シミュレーションスクリーニングの課題を克服すること。
  • 小分子からバイオマoleculesおよび2次元材料に至る多様な分子系において、スケーラブルかつ高精度な量子性質予測手法を開発すること。
  • 局所的原子フラグメント(amons)を用いて化学的環境効果を組み込むことで、周期律表の概念を拡張すること。
  • アクティブラーニングと移譲可能な機械学習モデルを活用して、化学的空間の効率的探索を可能にすること。
  • 局所的で移譲可能な構築ブロックから複雑な化学を体系的に再構築すること。

提案手法

  • 本手法は、原子の分子内状態(AIM)フラグメントを、化学的環境を表現する局所的構築ブロックとして用いる。
  • amonsを、量子化学データで訓練された移譲可能な量子機械学習(ML)モデルと統合する。
  • データ効率性を向上させるために、反復的に情報量の多い分子配置を選択するアクティブラーニングを採用する。
  • エネルギー、力、原子スピン、NMRシフト、極効率率といった重要な量子性質を予測する。
  • 有機分子、2次元材料、水クラスター、DNA塩基対、ユビキチンなど、さまざまな化学系間で転送学習が可能である。
  • amonsの組み合わせによって分子化学を体系的に再構築でき、メンデレーエフの周期律表に環境効果を組み込むことによって拡張される。

実験結果

リサーチクエスチョン

  • RQ1amonsは、化学的空間全体にわたり多様な量子化学的性質をモデル化するための普遍的で移譲可能な構築ブロックとして機能するか?
  • RQ2amonsに基づくMLと組みわせたアクティブラーニングは、量子化学におけるデータ効率性と予測精度をどのように向上させるか?
  • RQ3AMLモデルは、小分子からバイオマoleculesおよび2次元材料に至るさまざまな化学系に、どの程度一般化可能か?
  • RQ4AMLフレームワークは、局所的原子環境から複雑な化学を体系的に再構築できるか?
  • RQ5amonsに基づくアプローチは、化学的環境効果を組み込むことで、周期律表の概念的枠組みをどの程度拡張できるか?

主な発見

  • AMLモデルは、エネルギー、力、原子スピン、NMRシフト、極効率率といった量子性質を、多様な系において高い精度で予測する。
  • 本手法は高いスケーラビリティと移譲性を示し、有機分子からユビキチンに至る系においても信頼性の高い予測が可能である。
  • アクティブラーニングはデータ効率性を顕著に向上させ、必要な量子化学計算の回数を削減する。
  • amonsに基づく表現は化学的環境効果を効果的に捉えており、周期律表の有用性を局所的結合環境を含めたものに拡張している。
  • 局所的で移譲可能なフラグメントから複雑な化学を体系的に再構築でき、包括的な化学的空間探索を促進する。
  • 本フレームワークは、ワトソン=クリック型DNA塩基対や2次元材料といった挑戦的な系を、高い忠実度でモデル化できた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。