Skip to main content
QUICK REVIEW

[論文レビュー] A New Workflow for Materials Discovery Bridging the Gap Between Experimental Databases and Graph Neural Networks

Brandon Schoener, Yuting Hu|arXiv (Cornell University)|Jan 31, 2026
Machine Learning in Materials Science被引用数 0
ひとこと要約

論文本体は実験的な磁性材料データと ICSD からの CIF 構造を整合させて CGCNNs を Curie/Néel 温度の予測に用い、組成のみの整合より MAE と CCR の改善を示し、転移学習を可能にする。

ABSTRACT

Incorporating Machine Learning (ML) into material property prediction has become a crucial step in accelerating materials discovery. A key challenge is the severe lack of training data, as many properties are too complicated to calculate with high-throughput first principles techniques. To address this, recent research has created experimental databases from information extracted from scientific literature. However, most existing experimental databases do not provide full atomic coordinate information, which prevents them from supporting advanced ML architectures such as Graph Neural Networks (GNNs). In this work, we propose to bridge this gap through an alignment process between experimental databases and Crystallographic Information Files (CIF) from the Inorganic Crystal Structure Database (ICSD). Our approach enables the creation of a database that can fully leverage state-of-the-art model architectures for material property prediction. It also opens the door to utilizing transfer learning to improve prediction accuracy. To validate our approach, we align NEMAD with the ICSD and compare models trained on the resulting database to those trained on NEMAD originally. We demonstrate significant improvements in both Mean Absolute Error (MAE) and Correct Classification Rate (CCR) in predicting the ordering temperatures and magnetic ground states of magnetic materials, respectively.

研究の動機と目的

  • 高品質な訓練データが乏しい場合の磁性材料特性予測を迅速に行うための ML の活用を動機づける。
  • 実験データベースを ICSD からの CIF と整合させ、ML の完全構造データセットを作成するワークフローを提案する。
  • 整合データで訓練した CGCNN が組成のみのモデルより磁気特性予測で優れていることを示す。
  • 関連タスクからの転移学習が予測精度をさらに向上させることを示す。

提案手法

  • ICSD CIF と NEMAD 組成エントリを取得する。
  • CIF を reduced chemical formula と space group で NEMAD エントリと照合して整合データベースを作成する。
  • Niggli 縮約セルのメトリック張力に基づくノイズ指標を用いて整合の曖昧さを定量化する。
  • 整合データベース上でスクラッチから CGCNN を訓練し Néel/Curie 温度と磁気秩序を予測する。
  • 任意で事前訓練済み CGCNN を整合データベース上でファインチューニング(転移学習)する。
  • MAE、R^2、CCR で評価し、MagNData ベンチマークで検証する。

実験結果

リサーチクエスチョン

  • RQ1実験的磁性材料データを完全な CIF 構造と整合させることは、組成のみのアプローチと比べて磁気特性の予測精度を向上させるか?
  • RQ2整合の厳密さ(組成のみ vs 組成+空間群)が予測性能にどのような影響を与えるか?
  • RQ3データが限られている場合、関連の形成エネルギータスクからの転移学習は磁気特性予測をさらに高めるか?
  • RQ4整合データベースは MagNData のような手作業でキュレーションされたベンチマークとどの程度一致するか?

主な発見

Database AlignmentCurie MAENéel MAENéel MAE (TL)CCRNoise (ε)
No Alignment56K38KN/A0.90N/A
Composition44.7K28.9K25.6K0.937.51 Å^2
Composition + Space Group37.3K22.6K22.0K0.950.85 Å^2
  • 整合を組成+空間群で行った CGCNN は、組成のみまたは整合なしのベースラインと比較して Curie/Néel 温度予測を著しく改善する。
  • 形成エネルギーの事前訓練済み CGCNN からの転移学習は、特にデータセットが小さい場合に予測精度をさらに向上させる。
  • MagNData での検証は、予測 Néel 温度と実測値の良い一致を示し、MedAE は訓練データセットの MAE に匹敵する。
  • 整合プロセスは CIF 構造と磁気特性エントリ間の不一致を低減し、 ML モデルのグラフ表現を豊かにする。
  • このアプローチは、磁気特性予測において完全な構造情報が重要であることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。