Skip to main content
QUICK REVIEW

[论文解读] Machine learning force fields and coarse-grained variables in molecular dynamics: application to materials and biological systems

Paraskevi Gkeka, Gabriel Stoltz|arXiv (Cornell University)|Apr 15, 2020
Machine Learning in Materials Science参考文献 237被引用 222
一句话总结

对机器学习如何构建力场和粗粒化变量以用于原子级分子动力学的全面综述,涵盖数据库设计、描述子、回归方法,以及在材料与生物领域的应用。

ABSTRACT

Machine learning encompasses a set of tools and algorithms which are now becoming popular in almost all scientific and technological fields. This is true for molecular dynamics as well, where machine learning offers promises of extracting valuable information from the enormous amounts of data generated by simulation of complex systems. We provide here a review of our current understanding of goals, benefits, and limitations of machine learning techniques for computational studies on atomistic systems, focusing on the construction of empirical force fields from ab-initio databases and the determination of reaction coordinates for free energy computation and enhanced sampling.

研究动机与目标

  • 评估机器学习在分子动力学(MD)和粗粒化中的目标、收益与局限。
  • 解释如何从从头计算数据构建ML力场并用于MD模拟。
  • 讨论识别反应坐标和集体变量以实现增强采样的方法。
  • 探索机器学习在生物系统、药物发现和粗粒化建模中的应用。
  • 提供将ML与基于物理的方法结合以推动未来发展的观点。

提出的方法

  • 讨论用于ML力场的数据库构建,以及主动学习和在线学习的作用。
  • 描述原子描述子与回归选项,包括神经网络、核方法和线性模型。
  • 解释如何将对称性和物理约束引入描述子和模型。
  • 比较自下而上的粗粒化方法,以及从原子级PMF/FES数据学习势能的方法。
  • 概述使用数据驱动的降维以及慢速/方差大模态来识别集体变量的策略。

实验结果

研究问题

  • RQ1数据库选择和主动学习如何影响基于ML的力场的准确性与可迁移性?
  • RQ2哪些描述子和回归方法在材料与生物系统中能最好地兼顾精度、可迁移性和计算成本?
  • RQ3如何利用ML识别有意义的集体变量和反应坐标,以实现增强采样和粗粒化?
  • RQ4将ML力场与基于物理的模型及长程相互作用结合的挑战与前景?

主要发现

  • 在合适的训练数据与描述子条件下,ML势能可以达到与从头方法相当的高精度,但成本要低得多。
  • 具对称性意识的描述子和合适的回归方法对跨系统的可迁移性与鲁棒性具有关键影响。
  • 势能精度与适用域之间存在权衡,需在测试数据上进行严格验证。
  • 自下而上的粗粒化可以利用ML将高维PMF表示为有效的CG相互作用或平均力。
  • 数据驱动的CV发现有助于实现更好的增强采样和复杂分子系统的降维。
  • 将ML与物理基元(如长程相互作用)相结合,对全面的力场开发具有很大潜力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。