[论文解读] Deep Learning of Superconductors I: Estimation of Critical Temperature of Superconductors Toward the Search for New Materials
该论文提出了一种深度学习模型,采用一种新颖的“读取周期表”方法,仅通过化学成分预测超导体的临界温度(Tc),R² 达到 0.92。通过使用“垃圾输入”方法生成合成的非超导体数据,并在真实超导体数据上进行训练,该模型实现了 62% 的超导性预测精确率,并成功预测了训练数据之外的已知及新型超导体,包括 CaBi₂ 和铁基材料,其预测时间早于这些材料的实际发现。
Exploration of new superconductors still relies on the experience and intuition of experts and is largely a process of experimental trial and error. In one study, only 3% of the candidate materials showed superconductivity. Here, we report the first deep learning model for finding new superconductors. We introduced the method named reading periodic which represented the periodic table in a way that allows deep learning to learn to read the periodic table and to learn the law of elements for the purpose of discovering novel superconductors that are outside the training data. It is recognized that it is difficult for deep learning to predict something outside the training data. Although we used only the chemical composition of materials as information, we obtained an $R^{2}$ value of 0.92 for predicting $T_ ext{c}$ for materials in a database of superconductors. We also introduced the method named garbage-in to create synthetic data of non-superconductors that do not exist. Non-superconductors are not reported, but the data must be required for deep learning to distinguish between superconductors and non-superconductors. We obtained three remarkable results. The deep learning can predict superconductivity for a material with a precision of 62%, which shows the usefulness of the model; it found the recently discovered superconductor CaBi2 and another one Hf0.5Nb0.2V2Zr0.3, neither of which is in the superconductor database; and it found Fe-based high-temperature superconductors (discovered in 2008) from the training data before 2008. These results open the way for the discovery of new high-temperature superconductor families. The candidate materials list, data, and method are openly available from the link this https URL.
研究动机与目标
- 为克服超导体发现中试错法的局限性,开发一种可超越训练数据分布的、数据驱动的方法。
- 使深度学习能够理解周期表和化学组成,以预测超导临界温度(Tc)。
- 通过“垃圾输入”方法生成合成的非超导体材料,以应对非超导体数据稀缺的问题。
- 通过预测建模发现新型超导体,包括现有数据库中未收录的材料。
提出的方法
- 提出“读取周期表”方法——一种将周期表编码的表示方法,使深度学习能够学习元素间的关系与趋势。
- 仅以化学成分为输入,在真实超导体数据上训练深度神经网络以预测 Tc。
- 应用“垃圾输入”技术,生成不真实存在的、非超导体的合成材料,以提升模型的泛化能力。
- 利用模型基于预测的 Tc 对材料进行分类,判断其是否为超导体,设定超导性阈值。
- 通过 R² 评估 Tc 预测性能,通过分类准确率评估超导性预测性能。
- 在已知材料上验证模型预测,包括训练期后发现的材料。
实验结果
研究问题
- RQ1仅基于化学成分进行训练的深度学习模型,能否在训练分布外的材料上实现高精度的 Tc 预测?
- RQ2“垃圾输入”方法能否有效生成合成的非超导体数据,以提升模型对超导体与非超导体的区分能力?
- RQ3模型能否预测出未包含在训练数据中的已知超导体,包括在模型训练截止日期后才被发现的材料?
- RQ4模型能否预测出此前未报道的新型材料(如铁基或其它高 Tc 家族)的超导性?
- RQ5模型在复杂或非传统化学组成的材料上,其泛化能力能达到何种程度?
主要发现
- 该模型仅使用化学成分作为输入,预测超导体 Tc 的 R² 达到 0.92,表明其回归性能极强。
- 该模型以 62% 的精确率预测超导性,证明其具备区分超导体与非超导体的能力。
- 尽管未在训练数据中出现,该模型成功预测了 CaBi₂ 的存在,而 CaBi₂ 是近期发现的超导体。
- 该模型识别出 Hf₀.₅Nb₀.₂V₂Zr₀.₃ 作为一种潜在超导体,该材料此前未被报道具有超导性。
- 该模型在 2008 年前即预测出铁基高温超导体的存在,表明其预测能力超越了训练时间范围。
- 该模型的预测结果通过其在训练分布外材料(包括复杂化学计量比材料)上的泛化能力得到验证。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。