[论文解读] Dopamine: Brain Modes, Not Brains
本文提出 TauGate,一种在激活空间进行的 PEFT 方法,通过冻结基础权重并学习每个神经元的阈值和增益来门控神经元激活,实现可解释的模式切换,且参数预算较小。一个 MNIST 旋转模式的研究表明,在可训练参数很少的情况下仍具备竞争力的准确率,且门控具有可解释性。
Parameter-efficient fine-tuning (PEFT) methods such as \lora{} adapt large pretrained models by adding small weight-space updates. While effective, weight deltas are hard to interpret mechanistically, and they do not directly expose \emph{which} internal computations are reused versus bypassed for a new task. We explore an alternative view inspired by neuromodulation: adaptation as a change in \emph{mode} -- selecting and rescaling existing computations -- rather than rewriting the underlying weights. We propose \methodname{}, a simple activation-space PEFT technique that freezes base weights and learns per-neuron \emph{thresholds} and \emph{gains}. During training, a smooth gate decides whether a neuron's activation participates; at inference the gate can be hardened to yield explicit conditional computation and neuron-level attributions. As a proof of concept, we study ``mode specialization'' on MNIST (0$^\circ$) versus rotated MNIST (45$^\circ$). We pretrain a small MLP on a 50/50 mixture (foundation), freeze its weights, and then specialize to the rotated mode using \methodname{}. Across seeds, \methodname{} improves rotated accuracy over the frozen baseline while using only a few hundred trainable parameters per layer, and exhibits partial activation sparsity (a minority of units strongly active). Compared to \lora{}, \methodname{} trades some accuracy for substantially fewer trainable parameters and a more interpretable ``which-neurons-fire'' mechanism. We discuss limitations, including reduced expressivity when the frozen base lacks features needed for the target mode.
研究动机与目标
- 通过将类比神经调节的概念,说明在不重连权重的情况下实现自适应计算的动机。
- 开发 TauGate,在冻结基础权重的同时学习每个神经元的阈值和增益。
- 在 MNIST 0° 与 45° 旋转的模式专用化中以较小的参数预算进行演示。
- 将 TauGate 与仅偏置调优、LoRA 以及全量微调在受控情景下进行比较。
- 提供关于激活空间 PEFT 的可解释性与局限性的洞见。
提出的方法
- 定义 TauGate 为每个神经元的阈值和增益,门控为 g = sigmoid(s(z - tau)) 的平滑门控。
- 冻结基础权重,仅训练每层的 (tau, gamma);
- 在推理阶段可选择将门控硬化,从而获得显式的条件计算。
- 通过门控激活正则化来促进稀疏性。
- 量化参数数量并与基线进行对比(例如 BitFit、LoRA、Full FT)。
- 提供一个可复现的 MNIST 旋转实验,使用一个小型 MLP 与 DirectML。

实验结果
研究问题
- RQ1通过 TauGate 的激活空间门控,在权重固定的情况下是否能实现模式特定的专门化?
- RQ2与权重空间的 PEFT 方法相比, TauGate 在准确性和参数效率方面有何差异?
- RQ3 TauGate 是否通过硬门控的子网络提供可解释的神经元级归因?
- RQ4在数据受限的玩具设置中,门控型 PEFT 的权衡与局限性何在?
主要发现
| 方法 | 可训练参数 | Acc (0 ∘ ) | Acc (45 ∘ ) | 高激活比率 |
|---|---|---|---|---|
| Frozen (no adapt) | 0 | 0.832 ± 0.017 | 0.833 ± 0.016 | – |
| BitFit (bias-only) | 266 | 0.851 ± 0.005 | 0.852 ± 0.009 | – |
| TauGate (threshold tuning) | 512 | 0.850 ± 0.006 | 0.850 ± 0.010 | 0.28 |
| LoRA (r=8) | 10448 | 0.855 ± 0.006 | 0.864 ± 0.005 | – |
| Full FT | 118282 | 0.783 ± 0.007 | 0.887 ± 0.005 | – |
- TauGate 额外增加 512 个可训练参数,在专门化到旋转模式后,在 0° 与 45° 的 MNIST 上均达到 0.850 的准确率。
- 相较于冻结的主干, TauGate 在旋转模式准确率上有所提升,同时保留了原始模式的表现。
- BitFit(偏置仅)有 266 个可训练参数,分别得到 0.851(0°)和 0.852(45°)。
- LoRA(r=8)使用 10,448 个可训练参数,达到 0.855(0°)和 0.864(45°)。
- 全量微调使用 118,282 个可训练参数,分别得到 0.783(0°)和 0.887(45°)。
- TauGate 展现出部分激活稀疏性,在高激活单位占比为 0.28,表明有模式特定的门控。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。