QUICK REVIEW

[论文解读] Robust recognition and exploratory analysis of crystal structures via Bayesian deep learning

Andreas Leitherer, Angelo Ziletti|arXiv (Cornell University)|Mar 17, 2021

Machine Learning in Materials Science参考文献 71被引用 44

一句话总结

本文提出 ARISE，一种用于在 108 种结构类别（包括体相、二维和一维材料）中实现鲁棒、阈值无关的晶体结构识别的贝叶斯深度学习框架。ARISE 仅在理想结构上进行训练，即可准确分类来自模拟和实验的噪声单晶和多晶体系，同时提供与电子断层扫描数据中晶体有序度相关的合理不确定性估计。

ABSTRACT

Due to their ability to recognize complex patterns, neural networks can drive a paradigm shift in the analysis of materials science data. Here, we introduce ARISE, a crystal-structure identification method based on Bayesian deep learning. As a major step forward, ARISE is robust to structural noise and can treat more than 100 crystal structures, a number that can be extended on demand. While being trained on ideal structures only, ARISE correctly characterizes strongly perturbed single- and polycrystalline systems, from both synthetic and experimental resources. The probabilistic nature of the Bayesian-deep-learning model allows to obtain principled uncertainty estimates, which are found to be correlated with crystalline order of metallic nanoparticles in electron tomography experiments. Applying unsupervised learning to the internal neural-network representations reveals grain boundaries and (unapparent) structural regions sharing easily interpretable geometrical properties. This work enables the hitherto hindered analysis of noisy atomic structural data from computations or experiments.

研究动机与目标

开发一种可扩展、鲁棒的晶体结构识别方法，对结构噪声不敏感，且不依赖于人工设定的容差参数。
实现对广泛晶体结构（包括一维、二维和体相材料）的分类，超越现有方法的有限适用范围。
为预测提供合理的不确定性估计，可用于评估晶体有序度和数据质量。
通过内部神经网络表征的无监督学习，实现对原子结构的探索性分析。
克服传统基于对称性或局部结构的方法在处理复杂、噪声大或缺陷较多的纳米结构时的局限性。

提出的方法

使用原子位置平滑重叠（SOAP）描述符，将原子结构编码为旋转、平移和排列不变的向量。
采用全连接深度神经网络（多层感知机）基于 SOAP 描述符对结构进行分类。
应用贝叶斯神经网络（BNNs），通过近似后验推断，不仅输出预测结果，还提供校准后的不确定性估计。
在推理阶段利用蒙特卡洛 dropout 估计预测不确定性，近似高斯过程的不确定性。
对神经网络内部表征应用无监督学习（聚类与降维），以发现如晶界和不同结构区域等隐藏结构模式。
仅在理想晶体结构上训练模型，从而实现对噪声、扰动及实验重构体系的泛化能力。

实验结果

研究问题

RQ1仅在理想晶体结构上进行训练的深度学习模型，能否在噪声大、实验重构或存在缺陷的原子结构上实现稳健泛化？
RQ2贝叶斯不确定性估计与物理上可测量的晶体有序度（如金属纳米颗粒电子断层扫描中观察到的）之间的相关性如何？
RQ3对内部神经网络表征进行无监督分析，能否揭示如晶界或亚稳相等隐藏结构特征？
RQ4该模型在不进行网络架构或超参数重新设计的情况下，对复杂非体相晶体结构（如一维纳米管、二维材料）的分类能力有多强？
RQ5贝叶斯模型输出的不确定性是否真实反映了数据质量与结构无序程度，而非模型的过度自信？

主要发现

ARISE 尽管仅在理想结构上进行训练，仍能成功识别 108 种不同的晶体结构，包括一维、二维和体相材料。
该模型在来自合成和实验来源的强扰动单晶和多晶体系上保持高精度，包括原子电子断层扫描数据。
贝叶斯模型的预测不确定性估计与金属纳米颗粒中晶体有序度的程度高度相关，经电子断层扫描验证。
对内部神经网络表征的无监督分析揭示了具有可解释几何特性的晶界和结构上不同的区域。
该方法可泛化至复杂纳米结构（如纳米管），而这些结构无法被传统基于局部结构或空间群的方法识别。
不确定性估计可靠且反映真实物理无序，可在无外部参考的情况下实现数据质量评估。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。