[论文解读] Ultimate tensorization: compressing convolutional and FC layers alike
该论文通过将核张量重塑为更高阶的张量,将 Tensor Train 张量化扩展到卷积层,实现大幅网络压缩(高达80x),仅有极小的准确率损失,并与之前的全连接层压缩相结合。
Convolutional neural networks excel in image recognition tasks, but this comes at the cost of high computational and memory complexity. To tackle this problem, [1] developed a tensor factorization framework to compress fully-connected layers. In this paper, we focus on compressing convolutional layers. We show that while the direct application of the tensor framework [1] to the 4-dimensional kernel of convolution does compress the layer, we can do better. We reshape the convolutional kernel into a tensor of higher order and factorize it. We combine the proposed approach with the previous work to compress both convolutional and fully-connected layers of a network and achieve 80x network compression rate with 1.1% accuracy drop on the CIFAR-10 dataset.
研究动机与目标
- 动机:在不造成较大准确度损失的情况下减少CNN的存储与计算。
- 将张量因式分解扩展至卷积核,超越对4D TT-应用的天真方式。
- 展示更高阶张量重塑能够提升压缩效果。
- 展示卷积层和全连接层的联合压缩。
- 提供实用的训练方法和在 CIFAR-10 上可重复的结果。
提出的方法
- 通过将4D卷积核重塑为更高阶的张量,将卷积核表示为TT格式。
- 对重塑后的卷积核应用矩阵TT格式,以匹配全连接层张量化的好处。
- 使用自动微分结合SGD和动量训练TT核。
- 将TT-conv与对4D卷积核直接应用的天真TT分解进行比较。
- 将 TT-conv 与先前工作中的 TT-fc 相结合,以压缩整个网络。
- 在CIFAR-10上跨体系结构报告压缩与准确性权衡。
实验结果
研究问题
- RQ1TT-分解直接应用于卷积核是否会被通过将其重塑为更高阶张量以实现TT-卷积而超越?
- RQ2在同时压缩卷积层和全连接层时,可达到的压缩率和准确性权衡是什么?
- RQ3在CIFAR-10设置中,TT-conv 与对4D卷积核的天真TT应用相比有何不同?
- RQ4在卷积占优的网络上,是否可在保持较小准确率损失的前提下实现显著的网络压缩(如80x)?
- RQ5将卷积和FC的压缩结合在一起对整体性能与存储有何影响?
主要发现
- 直接对4D卷积核应用TT效果不佳;将其重塑为更高阶张量可获得更好的压缩。
- 单独使用TT-conv对卷积网络实现的压缩可达到约4x,CIFAR-10 上的准确率损失适中。
- 将 TT-conv 与先前工作中的 TT-fc 结合可实现最高约82x的网络压缩,准确率下降约1%。
- 对以卷积为主的网络,使用 TT-conv 可实现约4x 的压缩,准确率损失约2%(取决于 TT-ranks)。
- 将TT-fc与TT-conv结合压缩的卷积-全连接网络可实现显著收益,例如总压缩达到80x,准确率损失约1%。
- 该方法在 CIFAR-10 上得到验证,给出可重复的设置和两种基线架构。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。