Skip to main content
QUICK REVIEW

[论文解读] How to Stop Off-the-Shelf Deep Neural Networks from Overthinking.

Yiğitcan Kaya, Tudor Dumitraş|arXiv (Cornell University)|Oct 16, 2018
Adversarial Robustness in Machine Learning被引用 3
一句话总结

本文识别出现成深度神经网络中的'过度思考'现象——即模型在最终层之前就已正确预测,导致计算资源浪费并可能引发错误分类。为此,本文提出浅层-深层网络(SDN),通过在内部添加分类器实现基于置信度的早期退出,将平均推理成本降低50%以上,同时保持准确率,并通过一种新型混淆度量指标减轻有害的错误分类。

ABSTRACT

We characterize a prevalent weakness of deep neural networks (DNNs)---overthinking---which occurs when a DNN can reach correct predictions before its final layer. Overthinking is computationally wasteful, and it can also be destructive when, by the final layer, a correct prediction changes into a misclassification. Understanding overthinking requires studying how each prediction evolves during a DNN's forward pass, which conventionally is opaque. For prediction transparency, we propose the Shallow-Deep Network (SDN), a generic modification to off-the-shelf DNNs that introduces internal classifiers. We apply SDN to four modern architectures, trained on three image classification tasks, to characterize the overthinking problem. We show that SDNs can mitigate the wasteful effect of overthinking with confidence-based early exits, which reduce the average inference cost by more than 50% and preserve the accuracy. We also find that the destructive effect occurs for 50% of misclassifications on natural inputs and that it can be induced, adversarially, with a recent backdooring attack. To mitigate this effect, we propose a new confusion metric to quantify the internal disagreements that will likely lead to misclassifications.

研究动机与目标

  • 识别并表征预训练深度神经网络中的'过度思考'现象,即在最终层之前就已做出正确预测。
  • 减少因在早期正确预测后仍执行不必要的前向传播而导致的计算浪费。
  • 减轻最终层将正确预测更改为错误分类的风险,尤其是在对抗性条件下。
  • 开发一种通用、与架构无关的方法,以在不重新训练的情况下提升现有DNN的推理效率和鲁棒性。

提出的方法

  • 提出浅层-深层网络(SDN),一种通用的修改方法,将内部分类器插入到现成DNN的中间层。
  • 采用基于置信度的早期退出机制:若内部分类器的预测置信度超过阈值,则提前终止推理,避免完整前向传播。
  • 使用知识蒸馏方法从原始DNN最终层训练内部分类器,以保持准确率。
  • 提出一种新型混淆度量指标,用于量化不同分类器之间的内部不一致,识别出可能导致最终层错误分类的情形。
  • 在三个图像分类基准上,将SDN应用于四种现代网络架构(如ResNet、DenseNet)以评估性能。
  • 通过对抗性后门攻击测试所提缓解方法在诱发破坏性行为下的鲁棒性。

实验结果

研究问题

  • RQ1现成DNN在多大程度上存在'过度思考'现象,即在最终层之前就做出正确预测?
  • RQ2通过基于内部分类器置信度的早期退出机制,能节省多少计算成本?
  • RQ3最终层将正确预测更改为错误分类的频率如何?这种现象能否被预测或预防?
  • RQ4所提出的混淆度量指标是否能有效识别出预示最终层错误分类的内部不一致?
  • RQ5SDN框架在多大程度上可通用化应用于现有DNN,而无需重新训练?

主要发现

  • 在自然输入下,50%的错误分类中存在过度思考现象,即早期已做出正确预测,但被最终层改变。
  • 近期的后门攻击可诱发过度思考的破坏性效应,证明标准DNN存在脆弱性。
  • SDN通过基于置信度的早期退出机制,将平均推理成本降低50%以上,同时保持原始模型的准确率。
  • 所提出的混淆度量指标成功识别出预示最终层错误分类的内部不一致。
  • SDN框架在四种现代架构和三个图像分类任务中均表现有效,证明其广泛适用性。
  • SDN中的内部分类器在不重新训练原始DNN的前提下,保持了准确率并实现了高效推理。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。