Skip to main content
QUICK REVIEW

[论文解读] A General Theory of Equivariant CNNs on Homogeneous Spaces

Taco Cohen, Mario Geiger|arXiv (Cornell University)|Nov 5, 2018
Neural Networks and Applications参考文献 51被引用 36
一句话总结

本文提出了一种基于纤维丛理论的通用数学框架,用于在齐性空间上构建群等变卷积神经网络(G-CNNs)。该框架证明了所有在特征丛之间保持等变性的线性层均可表示为满足特定等变性约束的卷积核的卷积操作,并通过群表示和陪集空间对这些卷积核进行表征。该理论统一了现有各类G-CNNs,具有在欧氏空间、球面以及三维刚体运动等场景下的广泛适用性。

ABSTRACT

We present a general theory of Group equivariant Convolutional Neural Networks (G-CNNs) on homogeneous spaces such as Euclidean space and the sphere. Feature maps in these networks represent fields on a homogeneous base space, and layers are equivariant maps between spaces of fields. The theory enables a systematic classification of all existing G-CNNs in terms of their symmetry group, base space, and field type. We also consider a fundamental question: what is the most general kind of equivariant linear map between feature spaces (fields) of given types? Following Mackey, we show that such maps correspond one-to-one with convolutions using equivariant kernels, and characterize the space of such kernels.

研究动机与目标

  • 基于群作用和纤维丛理论,将多种多样的G-CNN架构统一于单一数学框架之下。
  • 解决在新型模态中缺乏系统性分类与新等变网络设计指导的问题。
  • 回答一个根本性问题:在给定对称类型特征场之间,最一般的等变线性映射形式是什么?
  • 提供一种将深度学习与现代数学和物理相连接的形式化体系,以促进跨领域洞察。

提出的方法

  • 将特征空间建模为在齐性空间 B ≅ G/H 上的主G-丛所关联的向量丛截面。
  • 通过稳定子子群H的表示ρ定义场类型,编码张量、向量或标量性质。
  • 建立在这些特征空间之间保持等变性的线性映射,等价于满足特定等变性约束的卷积核的卷积操作。
  • 以三种等价方式表征等变卷积核的空间:作为G上的函数、作为基空间B上的函数,或作为双陪集空间H₁\G/H₂上的函数。
  • 利用Mackey理论,证明等变映射与等变卷积核之间存在一一对应关系。
  • 将该形式化体系应用于具体情形:在球面上的SO(3)对称性、在三维空间中的SE(3)对称性,并推导出各向同性和非各向同性滤波器的卷积核约束条件。

实验结果

研究问题

  • RQ1在齐性空间B ≅ G/H上,保持给定群对称性的特征场之间的最一般线性映射形式是什么?
  • RQ2如何基于对称群G、基空间B ≅ G/H和场表示ρ,对现有G-CNNs进行系统性分类?
  • RQ3G-CNN中所有等变层是否都能表示为在群作用下保持等变的卷积核的卷积操作?
  • RQ4卷积核约束条件如何依赖于表示ρ的选择以及齐性空间的结构?
  • RQ5双陪集空间在参数化等变卷积核空间中起什么作用?

主要发现

  • 在齐性空间B ≅ G/H上的所有特征场之间,保持等变性的线性映射,等价于满足特定群作用下等变性条件的卷积核的卷积操作。
  • 等变卷积核的空间微同构于双陪集空间H₁\G/H₂上的矩阵值函数空间,且受表示相关约束。
  • 在具有SO(3)对称性的球面S²上,等变卷积核是[0, π)上的函数,仅在极点处受约束,从而推广了各向同性和非各向同性滤波器。
  • 在具有SE(3)对称性的三维空间ℝ³中,等变卷积核满足ϰ(rx) = ρ₂(r)ϰ(x)ρ₁(r⁻¹)(对所有r ∈ SO(3)),从而支持对3D数据的可导向CNN。
  • 该理论将现有G-CNNs(包括球面CNN和3D可导向CNN)统一于基于纤维丛和诱导表示的单一框架之下。
  • 该形式化体系可实现对新型数据类型(如对称域上的向量场或张量场)的等变架构进行系统化设计。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。