Skip to main content
QUICK REVIEW

[論文レビュー] Machine learning force fields and coarse-grained variables in molecular dynamics: application to materials and biological systems

Paraskevi Gkeka, Gabriel Stoltz|arXiv (Cornell University)|Apr 15, 2020
Machine Learning in Materials Science参考文献 237被引用数 222
ひとこと要約

機械学習が原子レベルMDの力場と粗視化変数を構築する方法の総合的レビューで、データベース設計、記述子、回帰手法、材料と生物学への適用を扱う。

ABSTRACT

Machine learning encompasses a set of tools and algorithms which are now becoming popular in almost all scientific and technological fields. This is true for molecular dynamics as well, where machine learning offers promises of extracting valuable information from the enormous amounts of data generated by simulation of complex systems. We provide here a review of our current understanding of goals, benefits, and limitations of machine learning techniques for computational studies on atomistic systems, focusing on the construction of empirical force fields from ab-initio databases and the determination of reaction coordinates for free energy computation and enhanced sampling.

研究の動機と目的

  • MDと粗視化における機械学習の目標、利点、および限界を評価する。
  • ML力場が第一原理データからどのように構築され、MDシミュレーションにどのように用いられるかを説明する。
  • 強化サンプリングのための反応座標と集団変数を特定する方法について論じる。
  • 生物系システム、創薬、および粗視化モデリングへの機械学習の応用を探る。
  • 将来の展開に向けて、機械学習を物理ベースのアプローチと統合する観点を提供する。

提案手法

  • ML力場のデータベース構築とアクティブラーニングおよびオンザフライ学習の役割について論じる。
  • 原子記述子と回帰オプションを説明する。ニューラルネットワーク、カーネル法、線形モデルを含む。
  • 対称性と物理的制約が記述子とモデルにどのように組み込まれるかを説明する。
  • 原子レベルPMF/FESデータから底層からの粗視化とポテンシャルの学習アプローチを比較する。
  • データ駆動の次元削減と遅い・大変動モードを用いて集合変数を識別する戦略を概説する。

実験結果

リサーチクエスチョン

  • RQ1データベースの選択とアクティブラーニングがMLベースの力場の精度と移植性にどのように影響するか?
  • RQ2材料と生物系全般において、精度、移植性、計算コストのバランスを最もよくとる記述子と回帰方法は何か?
  • RQ3強化サンプリングと粗視化のために意味のある集合変数と反応座標を同定するのにMLをどのように用いることができるか?
  • RQ4物理ベースのモデルや長距離相互作用とML力場を統合する際の課題と見通しは何か?

主な発見

  • 適切な訓練データと記述子が与えられれば、MLポテンシャルは第一原理法と同等の高い精度を、はるかに低いコストで達成できる。
  • 対称性を意識した記述子と適切な回帰方法は、システム間の移植性とロバスト性に極めて影響を与える。
  • ポテンシャルの精度と適用領域の間にはトレードオフがあり、テストデータでの厳密な検証が必要。
  • ボトムアップ粗視化は、MLを活用して高次元のPMFを有効なCG相互作用や平均力として表現できる。
  • データ駆動のCV探索は、複雑な分子系の強化サンプリングと次元削減を改善する。
  • MLと物理ベースの成分(例:長距離相互作用)の統合は、総合的な力場開発に有望である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。