Skip to main content
QUICK REVIEW

[论文解读] Symmetry-Driven Generation of Crystal Structures from Composition

Shi Yin, Junyi Mu|arXiv (Cornell University)|Feb 19, 2026
Machine Learning in Materials Science被引用 0
一句话总结

该论文提出一种对称性驱动的生成框架用于晶体结构预测,使用大型语言模型从组成中分配 Wyckoff 位点,结合线性时间的束搜索和扩散式三维结构生成,在不依赖模板的情况下达到最先进的 SUN 指标和匹配率。

ABSTRACT

Crystal structure prediction (CSP), which aims to predict the three-dimensional atomic arrangement of a crystal from its composition, is central to materials discovery and mechanistic understanding. However, given the composition in a unit cell, existing methods struggle with the NP-hard combinatorial challenge of rigorous symmetry enforcement or rely on retrieving known templates, which inherently limits both physical fidelity and the ability to discover genuinely new materials. To solve this, we propose a symmetry-driven generative framework. Our approach leverages large language models to encode chemical semantics and directly generate fine-grained Wyckoff patterns from atomic stoichiometry, effectively circumventing the limitations inherent to database lookups. Crucially, to overcome the exponentially complex problem of combinatorial site assignments, we incorporate domain knowledge through an efficient, linear-complexity heuristic beam search algorithm that rigorously enforces algebraic consistency between site multiplicities and atomic stoichiometry. By integrating this symmetry-consistent template into a diffusion backbone, our approach constrains the stochastic generative trajectory to a physically valid geometric manifold. This framework achieves state-of-the-art performance across stability, uniqueness, and novelty (SUN) benchmarks, alongside superior matching performance, thereby establishing a new paradigm for the rigorous exploration of targeted crystallographic space which can be previously uncharted, with no reliance on a priori structural knowledge.

研究动机与目标

  • 从组成和原子计数中强制实现晶体学对称性的 NP-hard 组合挑战
  • 开发基于 ab initio 的 Wyckoff 位点分配,不依赖现有模板或数据库
  • 将对称性一致的模板整合到扩散骨架中,约束生成处于物理有效的流形
  • 在保持高真实匹配率的同时,提高稳定性、唯一性和新颖性(SUN)

提出的方法

  • 使用两种 Transformer 基于的 LLM 从组成中推断细粒度晶体学对称性
  • LLM_g 输出基于扩展原子序列 C_atoms 的晶格群分布;选择 S_g 作为最可能的空间群
  • LLM_w 以 FiLM 条件化,在 S_g 下输出与 S_g 兼容的 Wyckoff 字母的概率
  • 将 Wyckoff 字母分配表述为一个带约束的优化问题(式(3)),强制执行位点重数和计量学约束
  • 应用线性复杂度的束搜索来求解该受约束的优化,避免指数级穷举枚举
  • 用预测的空间群和 Wyckoff 模板通过图神经网络骨干与对称性一致的矫正(晶格屏蔽与坐标投影)引导扩散式三维结构生成
Figure 1 : Schematic of the proposed symmetry-driven generative framework.
Figure 1 : Schematic of the proposed symmetry-driven generative framework.

实验结果

研究问题

  • RQ1是否能够直接从组成中推导出自洽对称性的Wyckoff位点的 ab initio 分配,而不依赖检索模板?
  • RQ2是否通过强制代数和几何对称性约束来提升 CSP 的稳定性、唯一性和新颖性?
  • RQ3在使用对称性驱动生成时,SUN 与真实匹配率相较于最先进基线在标准 CSP 基准上的表现如何?
  • RQ4将对称性约束整合到扩散轨迹对三维晶体生成有何影响?

主要发现

  • 与 DiffCSP++ 相比,所提出的方法在 MP-20、Perov-5、MPTS-52 基准上获得更高的 SUN 分数(稳定性、唯一性、新颖性及综合 SUN)。
  • 在 MP-20 上,SUN 从 14.55 提升到 35.58(稳定性 81.79,唯一性 100.0 ,新颖性 93.67)。
  • 在 Perov-5 上,SUN 从 73.39 提升到 92.42(稳定性 94.98,唯一性 100.0,新颖性 99.67)。
  • 在 MPTS-52 上,SUN 从 5.44 提升到 25.94(稳定性 42.43,唯一性 100.0,新颖性 70.53)。
  • 匹配率基准显示我们的方法在 MP-20、Perov-5、MPTS-52 上达到最先进的结果,超越 CDVAE、DiffCSP、CrystaLLM 基线以及 DiffCSP++ 模板方法。
  • 在 MP-20 上,匹配率:我们的方法 81.70 vs 74.65(DiffCSP++);Perov-5:99.95 vs 99.84;MPTS-52:43.26 vs 40.53。
(a) Retrieved and Prediction results of DiffCSP++.
(a) Retrieved and Prediction results of DiffCSP++.

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。