[论文解读] AuthorMix: Modular Authorship Style Transfer via Layer-wise Adapter Mixing
作者混合引入一种模块化风格迁移框架,使用在高资源作者上训练的分层风格特异性 LoRA 适配器进行混合,以少量示例快速适应新目标作者,在低资源目标上超越基线和 GPT-5.1,同时保持意义。
The task of authorship style transfer involves rewriting text in the style of a target author while preserving the meaning of the original text. Existing style transfer methods train a single model on large corpora to model all target styles at once: this high-cost approach offers limited flexibility for target-specific adaptation, and often sacrifices meaning preservation for style transfer. In this paper, we propose AuthorMix: a lightweight, modular, and interpretable style transfer framework. We train individual, style-specific LoRA adapters on a small set of high-resource authors, allowing the rapid training of specialized adaptation models for each new target via learned, layer-wise adapter mixing, using only a handful of target style training examples. AuthorMix outperforms existing, SoTA style-transfer baselines -- as well as GPT-5.1 -- for low-resource targets, achieving the highest overall score and substantially improving meaning preservation.
研究动机与目标
- 在降低训练成本的前提下,推动灵活、面向目标的作者风格迁移。
- 开发一个模块化框架,使得通过适配器能够快速适应新的目标风格。
- 在数据高效训练的同时,保持含义的准确传达。
- 通过适配器混合实现可解释的、分层控制的风格迁移。
提出的方法
- 在一组高资源作者上训练风格特定的 LoRA 适配器。
- 学习分层的适配器混合,以从现有适配器中组合目标风格。
- 仅使用少量目标风格数据即可实现对新目标风格的快速适应。
- 在强基线下评估并识别含义保留方面的改进。
- 与 SoTA 基线和 GPT-5.1 在低资源目标上的比较。
实验结果
研究问题
- RQ1在与现有基线相比时,作者混合在低资源目标作者上的表现如何?
- RQ2分层适配器混合是否在实现强风格迁移的同时提升含义保留?
- RQ3使用预训练适配器的模块化设置是否能在有限数据下实现对新目标风格的快速适应?
- RQ4在自动评估和人工评估中,作者混合与 SoTA 风格迁移方法相比如何?
主要发现
- 作者混合在低资源目标上优于现有 SoTA 风格迁移基线。
- 作者混合在低资源目标上优于 GPT-5.1。
- 该框架在自动和人工评估中都实现了最高总分,并大幅提升含义保留。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。