Skip to main content
QUICK REVIEW

[论文解读] SymmCD: Symmetry-Preserving Crystal Generation with Diffusion Models

Daniel Lévy, Siba Smarak Panigrahi|ArXiv.org|Feb 5, 2025
Crystallization and Solubility Studies被引用 5
一句话总结

SymmCD 是一种基于扩散的晶体生成器,通过使用 Wyckoff 基于不对称单元和位点对称性来明确强制晶体对称性,从而实现多样、有效且对称一致的晶体生成。

ABSTRACT

Generating novel crystalline materials has the potential to lead to advancements in fields such as electronics, energy storage, and catalysis. The defining characteristic of crystals is their symmetry, which plays a central role in determining their physical properties. However, existing crystal generation methods either fail to generate materials that display the symmetries of real-world crystals, or simply replicate the symmetry information from examples in a database. To address this limitation, we propose SymmCD, a novel diffusion-based generative model that explicitly incorporates crystallographic symmetry into the generative process. We decompose crystals into two components and learn their joint distribution through diffusion: 1) the asymmetric unit, the smallest subset of the crystal which can generate the whole crystal through symmetry transformations, and; 2) the symmetry transformations needed to be applied to each atom in the asymmetric unit. We also use a novel and interpretable representation for these transformations, enabling generalization across different crystallographic symmetry groups. We showcase the competitive performance of SymmCD on a subset of the Materials Project, obtaining diverse and valid crystals with realistic symmetries and predicted properties.

研究动机与目标

  • 需要生成具有准确对称性的晶体材料以影响性质和合成可行性的动机。
  • 开发一种在晶体生成过程中保证对称性保持的生成框架。
  • 提供一种紧凑、物理意义明确的表示,以提升多样性和相对于先前方法的计算效率。
  • 在材料项目数据的子集上展示具有竞争力的性能和对称性合规性。

提出的方法

  • 将晶体表示为基于 Wyckoff 位点的不对称单位,具有空间群 G 和晶格参数化 k。
  • 对晶格参数、不对称单位坐标、原子类型和位点对称性进行扩散,使用离散扩散处理类别分量,连续扩散处理坐标。
  • 为位点对称性和空间群对称性提供一种新颖的二元表示,以实现跨群体的信息共享和泛化。
  • 在不破坏晶体周期性的前提下,使用对称性编码的图神经网络去噪器对不对称单位代表进行操作。
  • 通过对称变换复制不对称单位以获得完整的晶胞,同时在训练和采样阶段保持对称性。
  • 利用 spglib 和 Wyckoff 位置理论在不对称单位表示和完整晶体结构之间建立映射。

实验结果

研究问题

  • RQ1是否可以训练一个扩散模型以生成原子处于对称允许的 Wyckoff 位置同时保持完整的空间群对称性?
  • RQ2与先前方法相比,显式对称性引入力是否提升了生成晶体的多样性和有效性?
  • RQ3提出的表示在不同空间群(包括罕见的群)上如何泛化,同时保持物理可行性?
  • RQ4限制空间群分布对生成质量和多样性的影响是什么?

主要发现

  • SymmCD 生成的晶体具有对称性、稳定性和有效性,且与强基线相比具有竞争力。
  • 该方法实现了与数据集一致的多样化空间群分布,与某些过拟合于低对称性样本的基线不同。
  • 基于紧凑的 Wyckoff 位点表示实现了跨位点对称性和空间群的信息共享,从而提高了效率。
  • SymmCD 能在训练数据中很少出现的空间群上也能泛化生成有效结构。
  • 该方法产生了新颖的模板(Wyckoff 序列)并避免了某些竞争方法中存在的模板限制导致的多样性不足。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。