Skip to main content
QUICK REVIEW

[论文解读] GaterNet: Dynamic Filter Selection in Convolutional Neural Network via a Dedicated Global Gating Network.

Zhourong Chen, Yang Li|arXiv (Cornell University)|Nov 27, 2018
Advanced Neural Network Applications参考文献 24被引用 21
一句话总结

GaterNet 在卷积神经网络中提出了一种基于专用全局门控网络的动态滤波器选择机制,该网络根据输入相关条件生成二值门控信号,以激活主干网络中的特定滤波器。该方法提升了模型的泛化能力,并在 CIFAR-10 上实现了最先进性能,在 ImageNet 上也实现了稳定提升。

ABSTRACT

The concept of conditional computation for deep nets has been proposed previously to improve model performance by selectively using only parts of the model conditioned on the sample it is processing. In this paper, we investigate input-dependent dynamic filter selection in deep convolutional neural networks (CNNs). The problem is interesting because the idea of forcing different parts of the model to learn from different types of samples may help us acquire better filters in CNNs, improve the model generalization performance and potentially increase the interpretability of model behavior. We propose a novel yet simple framework called GaterNet, which involves a backbone and a gater network. The backbone network is a regular CNN that performs the major computation needed for making a prediction, while a global gater network is introduced to generate binary gates for selectively activating filters in the backbone network based on each input. Extensive experiments on CIFAR and ImageNet datasets show that our models consistently outperform the original models with a large margin. On CIFAR-10, our model also improves upon state-of-the-art results.

研究动机与目标

  • 通过输入相关的动态滤波器选择来提升卷积神经网络的泛化能力。
  • 通过使不同滤波器专门处理不同类型输入,增强模型可解释性。
  • 开发一种简单但高效的深度卷积神经网络条件计算框架。
  • 在基准数据集上超越标准卷积神经网络和现有动态滤波器方法。

提出的方法

  • 引入一个全局门控网络,根据输入特征生成用于滤波器激活的二值门控信号。
  • 门控网络处理全局输入统计信息,生成决定主干网络中哪些滤波器被激活的门控值。
  • 滤波器选择是动态且依赖于输入的,使不同滤波器能够响应不同的输入模式。
  • 主干卷积神经网络执行标准卷积操作,但仅被门控网络激活的滤波器才对输出有贡献。
  • 整个系统通过标准分类损失进行端到端训练。
  • 二值门控实现了计算效率和模型稀疏性,提升了推理效率。

实验结果

研究问题

  • RQ1基于输入的动态滤波器选择是否能提升卷积神经网络的泛化能力和性能?
  • RQ2与其它动态路由机制相比,全局门控网络在滤波器选择中的表现如何?
  • RQ3动态滤波器选择是否能通过实现滤波器专业化来增强模型可解释性?
  • RQ4在 CIFAR-10 和 ImageNet 等标准基准上,可以实现多大的性能提升?
  • RQ5与现有动态卷积神经网络方法相比,所提出方法是否实现了最先进性能?

主要发现

  • GaterNet 在 CIFAR-10 和 ImageNet 数据集上均实现了对标准卷积神经网络的一致性能提升。
  • 在 CIFAR-10 上,该模型超越了最先进结果,展现出强大的泛化能力。
  • 动态滤波器选择机制通过实现按输入类型专门化的滤波器行为,增强了模型可解释性。
  • 使用二值门控在不损失准确率的前提下实现了计算效率和模型稀疏性。
  • 全局门控网络能够有效学习根据输入特征将输入路由到合适的滤波器。
  • 该框架简单但高效,在多个基准测试中均展现出强劲的实证结果。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。