Skip to main content
QUICK REVIEW

[論文レビュー] Atomic Permutationally Invariant Polynomials for Fitting Molecular Force Fields

Alice E. A. Allen, Gábor Cśanyi|arXiv (Cornell University)|Oct 23, 2020
Machine Learning in Materials Science参考文献 77被引用数 52
ひとこと要約

本論文は原子的置換不変多項式(aPIP)を分子系に拡張し、低階の項とデータ駆動フィットを組み合わせて、小さな有機分子の転送可能で高精度な力場を実現する。

ABSTRACT

We introduce and explore an approach for constructing force fields for small molecules, which combines intuitive low body order empirical force field terms with the concepts of data driven statistical fits of recent machine learned potentials. We bring these two key ideas together to bridge the gap between established empirical force fields that have a high degree of transferability on the one hand, and the machine learned potentials that are systematically improvable and can converge to very high accuracy, on the other. Our framework extends the atomic Permutationally Invariant Polynomials (aPIP) developed for elemental materials in [Mach. Learn.: Sci. Technol. 2019 1 015004] to molecular systems. The body order decomposition allows us to keep the dimensionality of each term low, while the use of an iterative fitting scheme as well as regularisation procedures improve the extrapolation outside the training set. We investigate aPIP force fields with up to generalised 4-body terms, and examine the performance on a set of small organic molecules. We achieve a high level of accuracy when fitting individual molecules, comparable to those of the many-body machine learned force fields. Fitted to a combined training set of short linear alkanes, the accuracy of the aPIP force field still significantly exceeds what can be expected from classical empirical force fields, while retaining reasonable transferability to both configurations far from the training set and to new molecules.

研究の動機と目的

  • 伝統的な転送可能な経験的力場とデータ駆動型機械学習ポテンシャルのギャップを埋めるため、aPIPベースの分子力場を開発する。
  • 体次元分解を用いて項の次元数を低く保ちつつ、体系的な4-体相互作用まで改善可能にする。
  • 正則化と反復データフィッティングを通じて滑らかなPESの外挿性を確保し、過剰適合を避ける。

提案手法

  • 総エネルギーを体次元順に4体成分まで、要素特有の成分を用いて分解する。
  • デカルト座標を回転不変な距離・角座標に変換し、主不変量および副不変量を用いて置換不変多項式を構築する。
  • 計算コストを抑えるために距離カットオフを課し、PESに穴が開かないよう滑らかなカットオフを用いる。
  • 基底関数の線形結合を正則化された線形最小二乗法でエネルギーと力にフィットする。
  • ラプラス正則化と両側カットオフを適用して滑らかさを促進し、PESの非物理的領域を防ぐ。
  • データ収集とフィッティングを反復的に行う方式でPESのカバレージと外挿性を向上させる。

実験結果

リサーチクエスチョン

  • RQ1制御された体次元を持つaPIPベースのポテンシャルは、関連分子間で転送性を高精度を維持して達成できるか?
  • RQ2体次元の制限と正則化の適用は、分子力場の精度と外挿挙動にどのような影響を与えるか?
  • RQ3距離-角座標と置換不変多項式は、小分子のPESフィッティングにおいて、完全な高次元MLアプローチと比べてどうか?

主な発見

  • 一般化された4体項までのaPIPベースの力場は、小さな有機分子に対して高精度を達成し、分子ごとに見れば多体ML力場に匹敵する。
  • 短鎖直線アルカンの結合トレーニング集合に適合させた場合、aPIPの精度は古典的な経験的力場を大幅に上回りつつ、トレーニング集合外や新しい分子への転送性を維持する。
  • 正則化と反復フィット方式はPESの滑らかさと外挿性を改善し、穴の発生を避けるのに役立つ。
  • 対称性適合多項式を用いた距離-角不変表現は、明示的な離散原子タイプなしで多元素系のスケーラブルな扱いを可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。