[论文解读] Technical Report: Combining knowledge from Transfer Learning during training and Wide Resnets
论文将 Wide ResNet 架构与受迁移学习启发的深度信息结合,改进 CNN 性能,提出在最后层引入深度信息的池化连接以及更深的残差阶段。
In this report, we combine the idea of Wide ResNets and transfer learning to optimize the architecture of deep neural networks. The first improvement of the architecture is the use of all layers as information source for the last layer. This idea comes from transfer learning, which uses networks pre-trained on other data and extracts different levels of the network as input for the new task. The second improvement is the use of deeper layers instead of deeper sequences of blocks. This idea comes from Wide ResNets. Using both optimizations, both high data augmentation and standard data augmentation can produce better results for different models. Link: https://github.com/wolfgangfuhl/PublicationStuff/tree/master/TechnicalReport1/Supp
研究动机与目标
- 通过利用来自所有网络层的信息传递到最终分类器来提升 CNN 泛化能力。
- 采用 Wide ResNet 的更深结构块以保留信息并实现更好的特征传播。
- 提出一种带有深度池化并在每个阶段提高深度的架构,以提升在标准基准上的准确性。
提出的方法
- 在每个残差块前沿添加沿深度的平均池化,并进行空间降维,为最后一层提供额外的信息源。
- 重新设计残差块,使每个阶段更深但块数更少(ResNet32 的深度翻倍),并集成前向传播的深度池化。
- 引入类似 ImageNet 风格的初始卷积输入,并对标准的 ResNet32、双深度变体以及新架构(NewNet)在有无所提信息路径的情况下进行比较。
- 在 CIFAR-100(32x32 输入)上使用 Shift+Flip 增强,标准 SGD 弹性动量,且每个模型训练 400 个 epoch 进行评估。
- 对比 Wide ResNet 28x10 与 FastAutoAugment 的效果,与所提方法比较以评估增强对准确性的影响。
实验结果
研究问题
- RQ1将来自所有层的信息提供给最终分类器是否能够提升泛化能力?
- RQ2在每个阶段增加深度(Wide ResNet 风格)是否在所提信息路径下带来更好的性能?
- RQ3在不同架构上,所提深度池化信息路径对 CIFAR-100 的准确度影响如何?
主要发现
| Model | Augmentation | CIFAR-100 精度 |
|---|---|---|
| ResNet32 | Shift + Flip | 76.7 |
| ResNet32 + Proposed | Shift + Flip | 77.6 |
| ResNet32 (Double depth) | Shift + Flip | 76.9 |
| ResNet32 (Double depth) + Proposed | Shift + Flip | 78.11 |
| NewNet (Figure 2 ) | Shift + Flip | 78.94 |
| NewNet (Figure 2 , double depth) | Shift + Flip | 79.67 |
| WideResNet 28x10 | FastAutoAugment | 82.01 |
| WideResNet 28x10 + Proposed | FastAutoAugment | 83.52 |
- 在 Shift+Flip 下,ResNet32 采用所提信息路径后准确度从 76.7 提升到 77.6。
- 带有所提路径的双深度 ResNet32 提升至 78.11。
- NewNet(图2)在所提路径下达到 79.67,是表格中非 Wide 模型中的最高值。
- WideResNet 28x10 在 FastAutoAugment 下达到 82.01,若结合所提路径则为 83.52。
- 深层阶段与所提信息源的组合在所测试的配置中带来最佳结果。
- 报告指出更广泛的数据增强(FastAutoAugment)和所提方法对不同模型均有帮助。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。