[论文解读] RMBRec: Robust Multi-Behavior Recommendation towards Target Behaviors
RMBRec 引入一个两模块鲁棒性框架,通过对齐辅助表示与目标表示并在行为环境间强制不变优化,在准确性和鲁棒性方面优于基线。
Multi-behavior recommendation faces a critical challenge in practice: auxiliary behaviors (e.g., clicks, carts) are often noisy, weakly correlated, or semantically misaligned with the target behavior (e.g., purchase), which leads to biased preference learning and suboptimal performance. While existing methods attempt to fuse these heterogeneous signals, they inherently lack a principled mechanism to ensure robustness against such behavioral inconsistency. In this work, we propose Robust Multi-Behavior Recommendation towards Target Behaviors (RMBRec), a robust multi-behavior recommendation framework grounded in an information-theoretic robustness principle. We interpret robustness as a joint process of maximizing predictive information while minimizing its variance across heterogeneous behavioral environments. Under this perspective, the Representation Robustness Module (RRM) enhances local semantic consistency by maximizing the mutual information between users' auxiliary and target representations, whereas the Optimization Robustness Module (ORM) enforces global stability by minimizing the variance of predictive risks across behaviors, which is an efficient approximation to invariant risk minimization. This local-global collaboration bridges representation purification and optimization invariance in a theoretically coherent way. Extensive experiments on three real-world datasets demonstrate that RMBRec not only outperforms state-of-the-art methods in accuracy but also maintains remarkable stability under various noise perturbations. For reproducibility, our code is available at https://github.com/miaomiao-cai2/RMBRec/.
研究动机与目标
- 在辅助信号嘈杂或与目标购买不对齐时,提升多行为推荐的鲁棒性。
- 提出一个原理性两模块框架,以同时处理局部语义漂移和全局优化稳定性。
- 在真实世界数据集上相对于最先进的基线展示更高的准确性与鲁棒性。
- 提供对推荐中行为异质性与不变性学习的洞见。
提出的方法
- 两大协同模块:表示鲁棒性模块(RRM)和优化鲁棒性模块(ORM)。
- RRM 使用目标锚定对比学习,在辅助表示与目标用户表示之间最大化互信息,从而将辅助信号与目标语义对齐。
- ORM 采用不变学习方法(受 IRM 启发,通过 Risk Extrapolation 实现)以在不同行为环境中最小化预测风险的方差,促进稳定优化。
- 为每种行为 b 构建行为编码器(使用 LightGCN),采用行为特定的 BPR 损失,再将净化后的嵌入等权融合以进行最终预测。
- 总体目标函数将目标行为的 BPR 损失与 L_RRM、L_ORM 正则项结合:L = L_main + lambda1 L_RRM + lambda2 L_ORM。
- 该框架基于在异质行为间最大化预测信息同时最小化其方差来实现。
实验结果
研究问题
- RQ1当辅助信号嘈杂或在语义上与目标行为不对齐时,如何提高多行为推荐的鲁棒性?
- RQ2局部(表示层面的)净化与全局(优化层面的)不变性是否联合提升在多样化行为环境中的准确性与鲁棒性?
- RQ3将不同行为视为独立环境对推荐中的不变学习有何影响?
- RQ4在带噪声扰动的真实多行为数据集上,RMBRec 相对于最先进基线有何表现?
主要发现
- RMBRec 在三个真实世界数据集上持续优于最先进的基线。
- 消融研究表明去掉 RRM 或 ORM 会显著下降性能,证实它们的重要性。
- Beibei 数据集呈现高行为对齐性(BAR)和低直接目标购买,显示在信号质量较高的场景中 RMBRec 能有效利用辅助信号。
- RMBRec 通过目标锚定对齐与不变优化展现出对嘈杂辅助信号和分布漂移的鲁棒性。
- 深度分析包括噪声注入测试和超参数敏感性分析,验证了该方法的稳定性与鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。