Skip to main content
QUICK REVIEW

[论文解读] On the Generalization of Equivariance and Convolution in Neural Networks to the Action of Compact Groups

Risi Kondor, Shubhendu Trivedi|arXiv (Cornell University)|Feb 11, 2018
Advanced Graph Neural Networks参考文献 20被引用 215
一句话总结

本文证明,在自然条件下,神经网络对紧致群作用的等变性等价于各层实现一个基于群运算和 Haar 测度的广义卷积;它提供一个严格的框架,将等变性与卷积联系起来,超越平移的情形。

ABSTRACT

Convolutional neural networks have been extremely successful in the image recognition domain because they ensure equivariance to translations. There have been many recent attempts to generalize this framework to other domains, including graphs and data lying on manifolds. In this paper we give a rigorous, theoretical treatment of convolution and equivariance in neural networks with respect to not just translations, but the action of any compact group. Our main result is to prove that (given some natural constraints) convolutional structure is not just a sufficient, but also a necessary condition for equivariance to the action of a compact group. Our exposition makes use of concepts from representation theory and noncommutative harmonic analysis and derives new generalized convolution formulae.

研究动机与目标

  • 激发将 CNN 风格的等变性扩展到超越平移的一般紧致群作用。
  • 提供一个严格的、表示论框架,统一卷积与等变性。
  • 证明对群及商空间的广义卷积对前馈网络的 G-等变性是必要且充分的。
  • 发展并给出作用于群及齐次空间上函数的广义卷积公式。
  • 强调对具有超越欧几里得平移对称性的数据进行处理的模型架构的影响。

提出的方法

  • 使用群运算和 Haar 测度在有限或可数群以及商空间上定义广义卷积。
  • 形式化 G-等变前馈网络,使每一层实现广义卷积。
  • 使用在 G 与齐次空间之间的提升与投影来处理在商空间上定义的激活。
  • 通过不可约表示(调和分析)将群上的卷积与其傅里叶空间表示联系起来。
  • 推导对应于 X = G, Y = G/H 以及 X = G/H, Y = H\backslash G 的卷积的特殊情况,包括带有双重陪集 (G/K) 的混合情况。
  • 先给出抽象理论,并在第六节给出具体示例。

实验结果

研究问题

  • RQ1在什么条件下,前馈网络对紧致群 G 的作用具有等变性?
  • RQ2如何将卷积泛化为作用于从 G 导出的商空间/齐次空间上的函数?
  • RQ3在作用于 G 或其齐次空间的网络中,等变性与广义卷积之间的关系是什么?
  • RQ4傅里叶分析(表示)如何描述这些空间上的广义卷积?
  • RQ5对于处理具有超越平移对称性的图、流形等数据的架构,有哪些实际影响?

主要发现

  • 前馈网络对紧致群 G 的等变性等价于每一层实现一个关于 G 的、由(1)推导出的广义卷积。
  • 卷积自然扩展到商空间和齐次空间,在 G/H、H\backslash G、以及 G/K 上产生良定义的运算。
  • 商空间上函数的傅里叶变换具有由表示在子群 H 和 K 上的分解方式决定的特定稀疏性模式。
  • 分析了三种主要卷积情形:X = G, Y = G/H;X = G/H, Y = H\backslash G;以及 X = G/H, Y = H\backslash G/K,每种都在相应的商空间上产生输出。
  • 商空间上的卷积与表示理论相连,提供一个分析和设计 G-等变神经网络的框架。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。