QUICK REVIEW

[논문 리뷰] TFPS: A Temporal Filtration-enhanced Positive Sample Set Construction Method for Implicit Collaborative Filtering

Jiayi Wu, Zhengyu Wu|arXiv (Cornell University)|2026. 02. 26.

Recommender Systems and Techniques인용 수 0

한 줄 요약

TFPS는 암시적 피드백에서 가중된 계층형 양성 샘플 세트를 구축하기 위한 시간 기반 여과를 도입하여 음수 샘플링 기반의 암시적 CF를 사용할 때 Recall@k와 NDCG@k를 향상시킵니다. 최근 상호작용에 가중치를 부여하고, 그래프 여과를 통해 계층화된 하위그래프를 생성하며, 현재 사용자 선호를 강조하기 위한 레이어 강화(레이어-강화)를 적용합니다.

ABSTRACT

The negative sampling strategy can effectively train collaborative filtering (CF) recommendation models based on implicit feedback by constructing positive and negative samples. However, existing methods primarily optimize the negative sampling process while neglecting the exploration of positive samples. Some denoising recommendation methods can be applied to denoise positive samples within negative sampling strategies, but they ignore temporal information. Existing work integrates sequential information during model aggregation but neglects time interval information, hindering accurate capture of users' current preferences. To address this problem, from a data perspective, we propose a novel temporal filtration-enhanced approach to construct a high-quality positive sample set. First, we design a time decay model based on interaction time intervals, transforming the original graph into a weighted user-item bipartite graph. Then, based on predefined filtering operations, the weighted user-item bipartite graph is layered. Finally, we design a layer-enhancement strategy to construct a high-quality positive sample set for the layered subgraphs. We provide theoretical insights into why TFPS can improve Recall@k and NDCG@k, and extensive experiments on three real-world datasets demonstrate the effectiveness of the proposed method. Additionally, TFPS can be integrated with various implicit CF recommenders or negative sampling methods to enhance its performance.

연구 동기 및 목표

암시적 피드백으로부터의 학습을 개선하기 위해 현재 사용자 선호를 반영하는 고품질 양성 샘플에 집중
데이터 수준의 시간 기반 여과 방식을 도입하여 계층화된 강화된 양성 샘플 세트를 구성
마진 증폭과 이를 Recall@k 및 NDCG@k에 미치는 이론적 정당성과 실험적 증거를 제시
TFPS가 다양한 암시적 CF 모델 및 음수 샘플링 전략과의 호환성을 입증

제안 방법

가장 최근의 사용자 상호작용 시간에 기반한 시간 감쇠를 사용하여 각 사용자-아이템 상호작용에 가중치를 부여
가중치 간격에 따라 가중된 이분 그래프를 여러 계층화된 하위그래프로 분할하기 위해 에지-가중치 필터링 적용
높은 가중치 엣지를 계층 인덱스에 따라 중복하여 양성 샘플 세트(PSS)를 형성하는 레이어-강화 체계 사용
PSS에서 BPR 손실로 학습하여 PSS에서의 발생 빈도에 따라 샘플을 간접 재가중
데이터 수준 재가중으로 인한 마진 증폭과 그것이 Recall@k 및 NDCG@k에 미치는 영향에 대한 이론적 분석 제시

실험 결과

연구 질문

RQ1TFPS가 양성 샘플에 시간 정보를 반영하여 암시적 CF 성능을 향상시킬 수 있는가?
RQ2레이어-강화 강도는 성능과 일반화에 어떤 영향을 미치는가?
RQ3TFPS가 서로 다른 음수 샘플링 전략 및 CF 모델과 호환되는가?
RQ4타임스탬프 분할 평가에서 TFPS와 순차 모델의 비교는 어떠한가?

주요 결과

Method	R@20_AmazonCDs	N@20_AmazonCDs	R@30_AmazonCDs	N@30_AmazonCDs	R@20_LastFM	N@20_LastFM	R@30_LastFM	N@30_LastFM	R@20_Ta-Feng	N@20_Ta-Feng	R@30_Ta-Feng	N@30_Ta-Feng
RNS	0.0270	0.0152	0.0354	0.0175	0.0649	0.0723	0.0777	0.0738	0.0516	0.0424	0.0636	0.0464
DNS	0.0285	0.0159	0.0357	0.0180	0.0608	0.0724	0.0792	0.0754	0.0440	0.0319	0.0552	0.0356
DNS (M,N)	0.0264	0.0150	0.0344	0.0171	0.0610	0.0736	0.0825	0.0778	0.0430	0.0295	0.0537	0.0331
MixGCF	0.0272	0.0153	0.0348	0.0174	0.0633	0.0744	0.0786	0.0775	0.0465	0.0334	0.0582	0.0373
DENS	0.0270	0.0149	0.0347	0.0170	0.0737	0.0756	0.0917	0.0790	0.0475	0.0401	0.0558	0.0429
AHNS	0.0271	0.0152	0.0342	0.0172	0.0703	0.0780	0.0811	0.0793	0.0528	0.0439	0.0692	0.0493
R-CE	0.0174	0.0096	0.0233	0.0112	0.0504	0.0614	0.0617	0.0631	0.0558	0.0450	0.0662	0.0484
T-CE	0.0197	0.0109	0.0263	0.0127	0.0427	0.0548	0.0584	0.0568	0.0550	0.0452	0.0669	0.0491
DeCA	0.0150	0.0082	0.0210	0.0099	0.0532	0.0605	0.0644	0.0624	0.0551	0.0450	0.0675	0.0493
DCF	0.0211	0.0116	0.0278	0.0135	0.0519	0.0603	0.0618	0.0613	0.0555	0.0454	0.0666	0.0492
PLD	0.0109	0.0061	0.0140	0.0070	0.0296	0.0251	0.0356	0.0259	0.0207	0.0170	0.0254	0.0186
STAM	0.0259	0.0144	0.0334	0.0165	0.0673	0.0732	0.0794	0.0759	0.0547	0.0418	0.0660	0.0456
TFPS-STAM	0.0281	0.0156	0.0351	0.0175	0.1098	0.0882	0.1382	0.0973	0.0707	0.0581	0.0863	0.0634
TFPS (Ours)	0.0308	0.0173	0.0388	0.0195	0.2153	0.2300	0.2485	0.2395	0.0771	0.0590	0.0915	0.0638

TFPS는 세 가지 실제 데이터셋(AmazonCDs, LastFM, Ta-Feng)에서 Recall@20/30 및 NDCG@20/30에 대해 최첨단 baselines를 능가합니다.
레이어-강화가 최근 상호작용을 강조하여 현재 선호에 모델의 집중을 향상시키고 장기 신호를 해치지 않습니다.
TFPS는 STAM 및 다른 음수 샘플링 방법과 통합되어 성능을 더욱 향상시킬 수 있으며(TFPS-STAM가 시연됨).
가중치가 높은 양수를 중복시키는 것이 마진 이득을 증폭시키고 타임스탬프 분할 평가에서 더 나은 랭킹 지표로 이어진다는 이론적 결과.
TFPS는 선형 시간복잡도 O(|E|)를 유지하며 학습 전 단일 전처리 패스만 필요로 한다

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.