[论文解读] Not Just a Black Box: Learning Important Features Through Propagating Activation Differences
论文介绍 DeepLIFT,一种通过将神经元激活与参考激活进行比较来计算特征重要性的方法,解决基于梯度的显著性方法的局限性。
Note: This paper describes an older version of DeepLIFT. See https://arxiv.org/abs/1704.02685 for the newer version. Original abstract follows: The purported "black box" nature of neural networks is a barrier to adoption in applications where interpretability is essential. Here we present DeepLIFT (Learning Important FeaTures), an efficient and effective method for computing importance scores in a neural network. DeepLIFT compares the activation of each neuron to its 'reference activation' and assigns contribution scores according to the difference. We apply DeepLIFT to models trained on natural images and genomic data, and show significant advantages over gradient-based methods.
研究动机与目标
- 在需要信任与发现的应用场景中,推动对可解释神经网络的需求。
- 提出一种通过将激活与参考激活进行比较来高效分配特征重要性的方法。
- 解决基于梯度的显著性方法的局限性,特别是在非激活的 ReLU 和饱和激活时。
- 在类似图像的数据和基因组数据上演示 DeepLIFT,以展示相对于基于梯度的方法的优势。
提出的方法
- 将贡献分数 C_xy 定义为神经元 x 相对于参考激活 A_n^0 对神经元 y 的影响,其中 delta_n = A_n - A_n^0。
- 强制两个性质:对 delta 的求和(对 y 的贡献之和等于 delta_y)以及跨网络层的线性组成。
- 通过类似反向传播的乘子 m_xy 来计算贡献,其中 C_xy = m_xy * delta_x,m_xt 从输出通过方程(3)-(5)推导得到。
- 为仿射、最大值、maxout 及其他激活提供获得 m_xy 的具体规则(例如,对于仿射,m_xy = w_xy;对于 max,m_xy = 指示函数{A_x = A_y} * delta_y/delta_x;等)。
- 处理特殊激活和实际问题(softmax 归一化、受约束输入的权重归一化,以及 softmax 衰减)以产生稳定且有意义的分数。
实验结果
研究问题
- RQ1来自参考输入的激活差异能否比梯度在神经网络中提供更可靠的特征重要性?
- RQ2如何在类似反向传播的框架中高效地计算特征归因,使其适用于常见激活函数(ReLU、sigmoid、tanh、maxout)和特殊层(softmax、池化)?
- RQ3DeepLIFT 分数是否在识别图像和基因组序列中的重要模式方面优于基于梯度的显著性方法?
- RQ4参考激活和归一化选择如何影响归因结果及稳定性?
主要发现
- DeepLIFT 通过将神经元激活与参考激活进行比较来提供归因分数,避免了零梯度盲点。
- 该方法保留对 delta 的求和性,并支持跨层线性组成,使得贡献的计算具有类似反向传播的特性。
- 应用于 Tiny ImageNet 和基因组序列,DeepLIFT 突出显示梯度方法可能错过的有信息量的特征(例如特定的 DNA 模式)。
- 等价性结果表明,当激活是分段线性且包含偏置时,gradient*input 相当于 Layer-Wise Relevance Propagation,但由于参考为非零,DeepLIFT 在实践中具有优势。
- 对于受限输入的权重归一化和对 softmax 的调整提升了常见架构中归因的可靠性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。