Skip to main content
QUICK REVIEW

[论文解读] Scale-Equivariant Steerable Networks

Ivan Sosnovik, Michał Szmaja|arXiv (Cornell University)|Oct 14, 2019
Geometric and Algebraic Topology参考文献 33被引用 43
一句话总结

本文提出一种使用可转动滤波器的尺度等变神经网络理论,实现在尺度-平移群上的尺度卷积,并在 MNIST-scale 和 STL-10 上在不进行插值的情况下达到最先进的结果。

ABSTRACT

The effectiveness of Convolutional Neural Networks (CNNs) has been substantially attributed to their built-in property of translation equivariance. However, CNNs do not have embedded mechanisms to handle other types of transformations. In this work, we pay attention to scale changes, which regularly appear in various tasks due to the changing distances between the objects and the camera. First, we introduce the general theory for building scale-equivariant convolutional networks with steerable filters. We develop scale-convolution and generalize other common blocks to be scale-equivariant. We demonstrate the computational efficiency and numerical stability of the proposed method. We compare the proposed models to the previously developed methods for scale equivariance and local scale invariance. We demonstrate state-of-the-art results on MNIST-scale dataset and on STL-10 dataset in the supervised learning setting.

研究动机与目标

  • 动机并形式化如何在卷积神经网络中处理除平移等变外的尺度变换。
  • 引入可转动滤波器参数化,以在不进行张量重采样的情况下实现尺度等变卷积。
  • 推导在尺度-平移群上进行尺度卷积的高效算法。
  • 展示 SESN 的计算效率和数值稳定性。
  • 在 MNIST-scale 和 STL-10 上,实证比较 SESN 与现有的尺度等变和局部尺度不变方法。

提出的方法

  • 定义尺度变换和用使滤波器缩放显式化的参数化来描述可转动滤波器(Equation 3)。
  • 使用群等变卷积(Equation 5–7)在尺度-平移群 H 上构建尺度卷积。
  • 确保非线性在缩放下对易,以保持等变性(Equation 8)。
  • 提供获取尺度不变表示的池化策略(最大尺度投影与空间/全局池化)。
  • 给出实际实现,采用可转动滤波器基底以避免张量重缩放(basis Þ; 使用带高斯包络的 Hermite 多项式)。
  • 提供 Conv T->H 和 Conv H->H 的高效计算方案,包括尺度间交互选项(Equations 9–10)。

实验结果

研究问题

  • RQ1如何构建同时对离散尺度因子和平移保持等变性的 CNN 层?
  • RQ2可转动滤波器参数化是否能够在多个尺度上实现快速、无插值的尺度卷积?
  • RQ3有哪些有效的池化策略可以在不丢失语义信息的情况下获得尺度不变性?
  • RQ4在准确性和效率方面,SESN 与现有的尺度等变或局部尺度不变结构相比如何?

主要发现

  • SESN 能够利用可转动滤波器对任意离散尺度因子实现尺度和平移的等变性。
  • 所提出的尺度卷积框架实现快速、无插值计算,速度与标准 CNN 相当。
  • 在 MNIST-scale 上,SESN 超越先前的尺度等变和局部尺度不变方法,标量和向量两种变体均显示出显著提升。
  • 在 STL-10 上,SESN 变体达到最先进的有监督准确度,超越了若干基线。
  • 使用尺度间交互可以提高性能,但可能引入更高的等变误差;仔细设计(如尺度投影)可实现稳健提升。
  • SESN 在现实离散化和深层结构下表现出低的等变误差,验证其实际可行性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。