Skip to main content
QUICK REVIEW

[论文解读] Ultimate tensorization: compressing convolutional and FC layers alike

Timur Garipov, Dmitry Podoprikhin|arXiv (Cornell University)|Nov 10, 2016
Tensor decomposition and applications参考文献 19被引用 102
一句话总结

该论文通过将核张量重塑为更高阶的张量,将 Tensor Train 张量化扩展到卷积层,实现大幅网络压缩(高达80x),仅有极小的准确率损失,并与之前的全连接层压缩相结合。

ABSTRACT

Convolutional neural networks excel in image recognition tasks, but this comes at the cost of high computational and memory complexity. To tackle this problem, [1] developed a tensor factorization framework to compress fully-connected layers. In this paper, we focus on compressing convolutional layers. We show that while the direct application of the tensor framework [1] to the 4-dimensional kernel of convolution does compress the layer, we can do better. We reshape the convolutional kernel into a tensor of higher order and factorize it. We combine the proposed approach with the previous work to compress both convolutional and fully-connected layers of a network and achieve 80x network compression rate with 1.1% accuracy drop on the CIFAR-10 dataset.

研究动机与目标

  • 动机:在不造成较大准确度损失的情况下减少CNN的存储与计算。
  • 将张量因式分解扩展至卷积核,超越对4D TT-应用的天真方式。
  • 展示更高阶张量重塑能够提升压缩效果。
  • 展示卷积层和全连接层的联合压缩。
  • 提供实用的训练方法和在 CIFAR-10 上可重复的结果。

提出的方法

  • 通过将4D卷积核重塑为更高阶的张量,将卷积核表示为TT格式。
  • 对重塑后的卷积核应用矩阵TT格式,以匹配全连接层张量化的好处。
  • 使用自动微分结合SGD和动量训练TT核。
  • 将TT-conv与对4D卷积核直接应用的天真TT分解进行比较。
  • 将 TT-conv 与先前工作中的 TT-fc 相结合,以压缩整个网络。
  • 在CIFAR-10上跨体系结构报告压缩与准确性权衡。

实验结果

研究问题

  • RQ1TT-分解直接应用于卷积核是否会被通过将其重塑为更高阶张量以实现TT-卷积而超越?
  • RQ2在同时压缩卷积层和全连接层时,可达到的压缩率和准确性权衡是什么?
  • RQ3在CIFAR-10设置中,TT-conv 与对4D卷积核的天真TT应用相比有何不同?
  • RQ4在卷积占优的网络上,是否可在保持较小准确率损失的前提下实现显著的网络压缩(如80x)?
  • RQ5将卷积和FC的压缩结合在一起对整体性能与存储有何影响?

主要发现

  • 直接对4D卷积核应用TT效果不佳;将其重塑为更高阶张量可获得更好的压缩。
  • 单独使用TT-conv对卷积网络实现的压缩可达到约4x,CIFAR-10 上的准确率损失适中。
  • 将 TT-conv 与先前工作中的 TT-fc 结合可实现最高约82x的网络压缩,准确率下降约1%。
  • 对以卷积为主的网络,使用 TT-conv 可实现约4x 的压缩,准确率损失约2%(取决于 TT-ranks)。
  • 将TT-fc与TT-conv结合压缩的卷积-全连接网络可实现显著收益,例如总压缩达到80x,准确率损失约1%。
  • 该方法在 CIFAR-10 上得到验证,给出可重复的设置和两种基线架构。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。