Skip to main content
QUICK REVIEW

[论文解读] TFPS: A Temporal Filtration-enhanced Positive Sample Set Construction Method for Implicit Collaborative Filtering

Jiayi Wu, Zhengyu Wu|arXiv (Cornell University)|Feb 26, 2026
Recommender Systems and Techniques被引用 0
一句话总结

TFPS 引入时间过滤来从隐式反馈中构建带权的分层正样本集合,在与基于负采样的隐式CF结合时提升 Recall@k 和 NDCG@k。它对最近的交互加权、通过图过滤形成分层子图,并应用层增强以强调当前用户偏好。

ABSTRACT

The negative sampling strategy can effectively train collaborative filtering (CF) recommendation models based on implicit feedback by constructing positive and negative samples. However, existing methods primarily optimize the negative sampling process while neglecting the exploration of positive samples. Some denoising recommendation methods can be applied to denoise positive samples within negative sampling strategies, but they ignore temporal information. Existing work integrates sequential information during model aggregation but neglects time interval information, hindering accurate capture of users' current preferences. To address this problem, from a data perspective, we propose a novel temporal filtration-enhanced approach to construct a high-quality positive sample set. First, we design a time decay model based on interaction time intervals, transforming the original graph into a weighted user-item bipartite graph. Then, based on predefined filtering operations, the weighted user-item bipartite graph is layered. Finally, we design a layer-enhancement strategy to construct a high-quality positive sample set for the layered subgraphs. We provide theoretical insights into why TFPS can improve Recall@k and NDCG@k, and extensive experiments on three real-world datasets demonstrate the effectiveness of the proposed method. Additionally, TFPS can be integrated with various implicit CF recommenders or negative sampling methods to enhance its performance.

研究动机与目标

  • 通过关注反映当前用户偏好的高质量正样本,推动从隐式反馈中获得更好的学习。
  • 引入数据层面的时间过滤方法,构建分层的增强正样本集合。
  • 提供边际放大性的理论依据及在真实数据集上的实证证据。
  • 证明 TFPS 与多种隐式CF模型及负采样策略的兼容性。

提出的方法

  • 对每次用户-物品互动基于最近一次互动时间的时间衰减进行加权。
  • 应用边权过滤,将加权的二部图按权重区间划分为多个分层子图。
  • 使用层增强方案,根据层索引对高权重边进行复制,形成正样本集合(PSS)。
  • 在 PSS 上使用 BPR 损失进行训练,隐式地通过 PSS 的出现频率重新加权样本。
  • 提供理论分析,展示数据层面的重加权如何放大边距,以及对 Recall@k 和 NDCG@k 的影响。

实验结果

研究问题

  • RQ1TFPS 是否通过将时间信息引入正样本来提升隐式CF 的性能?
  • RQ2层增强强度如何影响性能和泛化?
  • RQ3TFPS 是否与不同的负采样策略和CF模型兼容?
  • RQ4在带时间戳分区评估下,TFPS 与序列模型相比有何表现?

主要发现

  • TFPS 在三个真实数据集(AmazonCDs, LastFM, Ta-Feng)上对 Recall@20/30 与 NDCG@20/30 超越了现有基线。
  • 层增强强调最近的交互,使模型更关注当前偏好,同时不牺牲长期信号。
  • TFPS 可以与 STAM 等负采样方法结合以进一步提升性能(已展示 TFPS-STAM)。
  • 理论结果表明对高权重正样本的复制放大了边距收益,转化为带时间戳分区评估下的更好排序指标。
  • TFPS 维持线性时间复杂度 O(|E|),并在训练前需要一次预处理通过。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。