[论文解读] Group Equivariant Capsule Networks
本文提出群等变胶囊网络,通过在群元素上路由来保证姿态向量的等变性和激活的不变性,并将胶囊网络与群卷积相结合,以实现稀疏、姿态引导、等变的卷积神经网络,并具备解耦表示。
We present group equivariant capsule networks, a framework to introduce guaranteed equivariance and invariance properties to the capsule network idea. Our work can be divided into two contributions. First, we present a generic routing by agreement algorithm defined on elements of a group and prove that equivariance of output pose vectors, as well as invariance of output activations, hold under certain conditions. Second, we connect the resulting equivariant capsule networks with work from the field of group convolutional networks. Through this connection, we provide intuitions of how both methods relate and are able to combine the strengths of both approaches in one deep neural network architecture. The resulting framework allows sparse evaluation of the group convolution operator, provides control over specific equivariance and invariance properties, and can use routing by agreement instead of pooling operations. In addition, it is able to provide interpretable and equivariant representation vectors as output capsules, which disentangle evidence of object existence from its pose.
研究动机与目标
- 在胶囊网络中需要保证等变性和解耦表示的动机
- 定义以姿态作为群元素的群胶囊层并证明在群 G 下的等变性/不变性性质
- 开发在对局部感受野进行池化时仍能保持等变性的空间聚合方法
- 将群胶囊与群卷积相结合,构建稀疏、姿态引导且激活不变的CNN
- 在MNIST派生数据集上验证属性和表示解耦。
提出的方法
- 将 L_p 定义为群胶囊的姿态计算,L_a 定义为激活计算。
实验结果
研究问题
- RQ1能否在群元素上对齐路由以保证姿态的等变性和激活的不变性?
- RQ2在群胶囊网络中,如何在不破坏等变性的前提下进行局部空间聚合?
- RQ3群胶囊能否与群卷积集成以产生稀疏、姿态信息化且解耦表示的CNN?
- RQ4在如 MNIST 的标准数据集上,所提方法在群变换下是否能产生可验证的等变性/不变性属性?
主要发现
| 数据集 | CNN(*) | 胶囊网络 | 整体 |
|---|---|---|---|
| MNIST rot. (50k) | 92.30% | 81.64% | 90.19% |
| AffNist | 94.68% | 71.86% | 91.87% |
| MNIST rot. (50k) | 98.42% | 89.10% | 97.40% |
- 在给定等变均值和 delta 保留距离度量的前提下,群胶囊层能够产生对群变换左等变的姿态向量,以及对激活的不变性。
- 姿态对齐的核聚合解决了局部空间聚合中的非等变问题,使对变换输入的投票保持一致。
- 与群卷积的组合实现了稀疏评估,并在姿态保持等变的同时保持激活的不变性。
- 在旋转 MNIST 的概念验证实验中,激活实现了精确不变,姿态实现了很小数值误差的等变,且对未见旋转具有较好的泛化。
- 与姿态引导的 CNN 集成的体系结构在旋转 MNIST 和 AFFNIST 上达到具有竞争力的准确率,同时参数量远少于某些基线。
- 表示包含解耦的姿态向量,以及通过姿态变换重建或操作图像的可能性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。