Skip to main content
QUICK REVIEW

[論文レビュー] TFPS: A Temporal Filtration-enhanced Positive Sample Set Construction Method for Implicit Collaborative Filtering

Jiayi Wu, Zhengyu Wu|arXiv (Cornell University)|Feb 26, 2026
Recommender Systems and Techniques被引用数 0
ひとこと要約

TFPSは潜在フィードバックから重み付きの層状正例セットを構築するための時間的濾過を導入し、負サンプリングベースの暗黙的CFと組み合わせたときにRecall@kとNDCG@kを改善します。近接インタラクションに重みを付け、グラフ濾過による層状の部分グラフを作成し、現在のユーザー好みを強調する層強化を適用します。

ABSTRACT

The negative sampling strategy can effectively train collaborative filtering (CF) recommendation models based on implicit feedback by constructing positive and negative samples. However, existing methods primarily optimize the negative sampling process while neglecting the exploration of positive samples. Some denoising recommendation methods can be applied to denoise positive samples within negative sampling strategies, but they ignore temporal information. Existing work integrates sequential information during model aggregation but neglects time interval information, hindering accurate capture of users' current preferences. To address this problem, from a data perspective, we propose a novel temporal filtration-enhanced approach to construct a high-quality positive sample set. First, we design a time decay model based on interaction time intervals, transforming the original graph into a weighted user-item bipartite graph. Then, based on predefined filtering operations, the weighted user-item bipartite graph is layered. Finally, we design a layer-enhancement strategy to construct a high-quality positive sample set for the layered subgraphs. We provide theoretical insights into why TFPS can improve Recall@k and NDCG@k, and extensive experiments on three real-world datasets demonstrate the effectiveness of the proposed method. Additionally, TFPS can be integrated with various implicit CF recommenders or negative sampling methods to enhance its performance.

研究の動機と目的

  • Implicit feedbackからの学習を改善し、現在のユーザー好みを反映する高品質な正のサンプルに焦点を当てる。
  • データレベルの時間的濾過アプローチを導入して、層状の強化正のサンプルセットを構築する。
  • マージン増幅の理論的正当化と実世界データセットでの経験的証拠を提供する。
  • TFPSのさまざまな暗黙的CFモデルと負サンプリング戦略との互換性を示す。

提案手法

  • 各ユーザー-アイテムインタラクションを、最も最近のユーザーインタラクション時刻に基づく時間減衰で重み付けする。
  • エッジ重み濾過を適用して、重み区間ごとに重み付き二部グラフを複数の層状サブグラフに分割する。
  • 層インデックスに従って高重みエッジを複製する層強化方式を用いて正のサンプルセット(PSS)を形成する。
  • PSS上でBPR損失を用いて学習し、PSS内の出現頻度でサンプルを暗黙的に再重み付けする。
  • データレベルの再重み付けからマージン増幅を示す理論分析と、それがRecall@kとNDCG@kに与える影響を提供する。

実験結果

リサーチクエスチョン

  • RQ1TFPSは正のサンプルに時間情報を組み込むことで潜在的CFの性能を向上させるか。
  • RQ2層強化の強度は性能と一般化能力にどう影響するか。
  • RQ3TFPSは異なる負サンプリング戦略やCFモデルと互換性があるか。
  • RQ4タイムスタンプで区分した評価において、TFPSは逐次モデルとどのように比較されるか。

主な発見

MethodR@20_AmazonCDsN@20_AmazonCDsR@30_AmazonCDsN@30_AmazonCDsR@20_LastFMN@20_LastFMR@30_LastFMN@30_LastFMR@20_Ta-FengN@20_Ta-FengR@30_Ta-FengN@30_Ta-Feng
RNS0.02700.01520.03540.01750.06490.07230.07770.07380.05160.04240.06360.0464
DNS0.02850.01590.03570.01800.06080.07240.07920.07540.04400.03190.05520.0356
DNS (M,N)0.02640.01500.03440.01710.06100.07360.08250.07780.04300.02950.05370.0331
MixGCF0.02720.01530.03480.01740.06330.07440.07860.07750.04650.03340.05820.0373
DENS0.02700.01490.03470.01700.07370.07560.09170.07900.04750.04010.05580.0429
AHNS0.02710.01520.03420.01720.07030.07800.08110.07930.05280.04390.06920.0493
R-CE0.01740.00960.02330.01120.05040.06140.06170.06310.05580.04500.06620.0484
T-CE0.01970.01090.02630.01270.04270.05480.05840.05680.05500.04520.06690.0491
DeCA0.01500.00820.02100.00990.05320.06050.06440.06240.05510.04500.06750.0493
DCF0.02110.01160.02780.01350.05190.06030.06180.06130.05550.04540.06660.0492
PLD0.01090.00610.01400.00700.02960.02510.03560.02590.02070.01700.02540.0186
STAM0.02590.01440.03340.01650.06730.07320.07940.07590.05470.04180.06600.0456
TFPS-STAM0.02810.01560.03510.01750.10980.08820.13820.09730.07070.05810.08630.0634
TFPS (Ours)0.03080.01730.03880.01950.21530.23000.24850.23950.07710.05900.09150.0638
  • TFPSは三つの実世界データセット(AmazonCDs, LastFM, Ta-Feng)でRecall@20/30およびNDCG@20/30の点で最先端のベースラインを上回る。
  • 層強化は最近のインタラクションを強調し、現在の好みに対するモデルの焦点を高めつつ長期信号を損なわない。
  • TFPSはSTAMおよび他の負サンプリング手法と統合してさらに性能を向上させうる(TFPS-STAMを示す)。
  • 高重み正例を複製することでマージンの利得が増幅され、タイムスタンプ区分評価の下でランキング指標が改善されるという理論的結果。
  • TFPSは線形時間計算量O(|E|)を維持し、学習前の単一の前処理パスを必要とする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。