Skip to main content
QUICK REVIEW

[論文レビュー] M-CODE: Materials Categorization via Ontology, Dimensionality and Evolution

Vsevolod Biryukov, Kamal Choudhary|arXiv (Cornell University)|Feb 16, 2026
Machine Learning in Materials Science被引用数 0
ひとこと要約

M-CODE は、現実的な材料構造のオントロジー駆動型分類システムをコンパクトに提示し、ドメイン概念を再利用可能なソフトウェアエンティティと出所認証付きビルド変換にリンクします。オープンな JSON スキーマとコードとして実装されました。

ABSTRACT

The rapid advancement of artificial intelligence in materials science requires data standards and data management practices that can capture the complexity of real-world structures, including surfaces, interfaces, defects, and dimensionality reduction. We present M-CODE - Materials Categorization via Ontology, Dimensionality and Evolution - a compact categorization system that links materials-science-specific terminology to a set of reusable concepts as building blocks and provenance-aware transformations. M-CODE classifies structures by dimensionality, structural complexity (from pristine to compound pristine, defective, and processed), and variants that capture common structure creation and evolution approaches. A practical implementation of the categorization is provided in an open-source codebase that includes JSON schemas, examples, and Python and TypeScript types/interfaces, designed to support reproducible dataset generation, validation, and community contributions.

研究の動機と目的

  • 理想化されたトレーニング構造と現実的で欠陥を含みインターフェースが豊富な材料とのギャップを埋める。
  • 次元、ドメイン、バリアントによる構造のコンパクトでドメイン根拠の分類を定義する。
  • JSON スキーマとソフトウェアインターフェイスへマッピング可能なエンティティと操作のオントロジーを提供する。
  • 構造構築の出所を把握し、再現可能なデータセット生成と共有を支援する。

提案手法

  • 材料構造のビルディングブロックと変換を記述する4カテゴリのエンティティ/操作オントロジーを開発する。
  • JSON スキーマを用いて設定を検証・やり取りし、スキーマから Python および TypeScript バインディングを自動生成する。
  • 材料生成を、構成、ビルダー、結果として明示的な出所メタデータとともに表現する。
  • 構造ターゲットを再現可能なビルドワークフローに接続するための進化経路(素子 pristine、化合物 pristine、欠陥、加工済み)を定義する。
  • 検証と再利用のための参照実装とオープンなスキーマ(mat3ra-esse)を提供する。
Figure 2: Representative target structure classes grouped by domain and annotated with the corresponding M-CODE tags. See Table 5 . Pristine Structures (top row): MoS 2 monolayer, SrTiO 3 slab, Si nanowire, and graphene nanoribbon. Compound Pristine Structures (second row): Si/SiO 2 /HfO 2 /TiN hete
Figure 2: Representative target structure classes grouped by domain and annotated with the corresponding M-CODE tags. See Table 5 . Pristine Structures (top row): MoS 2 monolayer, SrTiO 3 slab, Si nanowire, and graphene nanoribbon. Compound Pristine Structures (second row): Si/SiO 2 /HfO 2 /TiN hete

実験結果

リサーチクエスチョン

  • RQ1現実的で低次元・異質な材料構造をどのように標準化してデータセット生成とワークフロー再現性を確保できるか。
  • RQ2コンパクトでオントロジーに基づく分類と出所認証付き変換は、材料データフレームワーク内のツールとデータベース間の相互運用性を改善できるか。
  • RQ3ドメイン用語を再利用可能なソフトウェアエンティティへマッピングして、自動ワークフロールーティングと FAIR データ実践を実現できるか。

主な発見

  • ドメイン、次元、カテゴリ、バリアントによる安定した M-CODE タグを持つ構造を分類するコンパクトな分類フレームワーク。
  • エンティティと操作のオープンなソフトウェア指向オントロジーを JSON スキーマと言語バインディングへマッピングして再現可能なビルドを実現できる。
  • 出所認証付きの構成と変換により、追加コンテキストのための寛容なメタデータとともに構造を明示的に再生成できる。
  • このアプローチはカテゴリ認識ワークフロールーティングと FAIR データ原則をサポートし、AI/ML の準備性と再現可能なデータセットを実現する。
  • この研究は検証と再利用のための標準化スキーマ成果物と、検証と再利用のために mat3ra-esse として配布される参照実装を提供する。
M-CODE: Materials Categorization via Ontology, Dimensionality and Evolution

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。