[论文解读] ReasonAny: Incorporating Reasoning Capability to Any Model via Simple and Effective Model Merging
ReasonAny 引入一种无需训练的方法,通过简单的模型合并将推理能力与任意基础模型相结合,通过排除机制解决参数冲突并在保持安全对齐的同时保留完整性。
Large Reasoning Models (LRMs) with long chain-of-thought reasoning have recently achieved remarkable success. Yet, equipping domain-specialized models with such reasoning capabilities, referred to as "Reasoning + X", remains a significant challenge. While model merging offers a promising training-free solution, existing methods often suffer from a destructive performance collapse: existing methods tend to both weaken reasoning depth and compromise domain-specific utility. Interestingly, we identify a counter-intuitive phenomenon underlying this failure: reasoning ability predominantly resides in parameter regions with low gradient sensitivity, contrary to the common assumption that domain capabilities correspond to high-magnitude parameters. Motivated by this insight, we propose ReasonAny, a novel merging framework that resolves the reasoning-domain performance collapse through Contrastive Gradient Identification. Experiments across safety, biomedicine, and finance domains show that ReasonAny effectively synthesizes "Reasoning + X" capabilities, significantly outperforming state-of-the-art baselines while retaining robust reasoning performance.
研究动机与目标
- 促进高效开发具备推理能力的模型,而不需要完全重新训练。
- 实现以单步将推理技能与领域特定能力进行合成。
- 在模型合并过程中通过简单的排除基方法解决参数冲突。
- 评估对安全对齐的影响以及对越狱或安全性下降的潜在减缓。
提出的方法
- 提出一个简单的模型合并框架,将推理能力注入到任意模型。
- 使用排除过程来解决推理子空间与领域特定子空间之间的冲突参数。
- 聚焦于无需训练基础模型的合成。
- 在合并过程中识别并保留安全对齐参数,以降低越狱风险。
- 讨论在识别阶段使用梯度归因所带来的计算权衡。
实验结果
研究问题
- RQ1ReasonAny 是否能在不重新训练的情况下有效将推理能力整合到任意基础模型中?
- RQ2排除式合并是否在不降低领域特定性能的前提下减少参数冲突?
- RQ3ReasonAny 在合并后能否较好地保留安全对齐并减轻安全性下降?
- RQ4与权重平均方法相比,识别阶段的计算开销有哪些?
主要发现
- ReasonAny 使基础模型能够在无需训练的情况下合成具备领域特定能力的推理。
- 排除机制解决了推理与领域子空间之间的参数冲突,尽量减少干扰。
- ReasonAny 保留安全对齐参数,相较于其他合并技术,降低了越狱或安全性下降的风险。
- 该方法揭示了识别阶段中基于梯度的归因导致的计算开销。
- 局限性包括在复杂任务中子空间之间可能存在重叠,以及当前仅聚焦两模型合并。
- 更广泛的影响表明开发具备推理能力的模型将减少资源使用与碳足迹。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。