[논문 리뷰] PI2I: A Personalized Item-Based Collaborative Filtering Retrieval Framework
PI2I는 후보 풀을 느슨해진 인덱서 단계로 확장하고 인터랙티브 스코어링 단계를 적용하여 아이템 간 필터링을 개인화하는 두 단계 검색 프레임워크를 도입합니다. 이는 Taobao에서 검색 정확도와 온라인 성능을 향상시키고, 벤치마킹용 대규모 Taobao 상호작용 데이터셋도 제공합니다.
Efficiently selecting relevant content from vast candidate pools is a critical challenge in modern recommender systems. Traditional methods, such as item-to-item collaborative filtering (CF) and two-tower models, often fall short in capturing the complex user-item interactions due to uniform truncation strategies and overdue user-item crossing. To address these limitations, we propose Personalized Item-to-Item (PI2I), a novel two-stage retrieval framework that enhances the personalization capabilities of CF. In the first Indexer Building Stage (IBS), we optimize the retrieval pool by relaxing truncation thresholds to maximize Hit Rate, thereby temporarily retaining more items users might be interested in. In the second Personalized Retrieval Stage (PRS), we introduce an interactive scoring model to overcome the limitations of inner product calculations, allowing for richer modeling of intricate user-item interactions. Additionally, we construct negative samples based on the trigger-target (item-to-item) relationship, ensuring consistency between offline training and online inference. Offline experiments on large-scale real-world datasets demonstrate that PI2I outperforms traditional CF methods and rivals Two-Tower models. Deployed in the "Guess You Like" section on Taobao, PI2I achieved a 1.05% increase in online transaction rates. In addition, we have released a large-scale recommendation dataset collected from Taobao, containing 130 million real-world user interactions used in the experiments of this paper. The dataset is publicly available at https://huggingface.co/datasets/PI2I/PI2I, which could serve as a valuable benchmark for the research community.
연구 동기 및 목표
- 전통적인 아이템 기반 CF와 Two-Tower 모델을 넘어서는 대규모 추천 시스템에서 개인화된 검색의 필요성을 제시한다.
- 먼저 후보 풀을 확장하는(IBS) 두 단계의 PI2I 프레임워크를 제안하고 그 후 인터랙티브 개인화 점수화(PRS)를 적용한다.
- 트리거-타깃 음수 샘플링 전략과 특화된 손실을 통해 오프라인 학습과 온라인 추론을 일치시킨다.
- Taobao 배포에서의 오프라인 이득과 온라인 영향력을 시연하고 연구 용도의 대규모 Taobao 상호작용 데이터셋을 제공한다.
제안 방법
- IBS: 자르기 임계값을 완화하여 Hit Rate를 최대화하고 Swing 기반 스코어링으로 각 트리거당 더 많은 후보 아이템을 유지하며 아이템 간(i2i) 테이블을 구축한다.
- PRS: 타깃 어텐션과 교차 특성 상호작용을 활용한 인터랙티브 스코어링 모델로 후보를 점수화한다; 검색 점수를 위해 다중 헤드 타깃 어텐션을 활용한다.
- Trigger-Target 샘플링: 다음 클릭 아이템의 양수들로 학습하고, 관련 타깃에서 어려운 음수와 비트리거된 관련 아이템에서 쉬운 음수를 생성하여 오프라인과 온라인 프로세스를 일치시킨다.
- 손실: 양의 로짓이 음의 로짓보다 큰 음의 로그 가능도(L^p)를 최적화한다.
- 추론: 사용자 이력의 트리거와 i2i_table 후보를 사용하여 대규모 후보 공간(Top-K)에서 온라인 비동기 스코어링을 수행한다.

실험 결과
연구 질문
- RQ1IBS 단계에서 자르기 임계값을 완화해 Hit Rate를 향상시키되 계산 비용이 부담스럽지 않게 할 수 있는가?
- RQ2PRS의 인터랙티브 스코어링 방식이 아이템 개인화 추천에서 내적 곱 기반 검색을 능가하는가?
- RQ3Trigger-Target 기반 음수 샘플링이 오프라인 학습과 온라인 추론 간의 일관성을 향상시키는가?
- RQ4대규모 산업 데이터와 공개 Taobao 데이터셋에서 PI2I가 CF 및 일반적인 Two-Tower 모델에 비해 어떤 성능을 보이는가?
주요 결과
- PI2I는 대규모 실제 데이터셋의 오프라인 실험에서 전통적인 CF 방법을 능가하고 Two-Tower 모델에 필적한다.
- Taobao에서 PI2I는 Guess You Like 섹션에서 온라인 거래율을 1.05% 증가시켰다.
- PI2I는 Dense 데이터셋(KuaiRec)에서 강한 성능을 보이고 희소한 Taobao 데이터셋에서도 경쟁력 있는 결과를 보이며 특히 큰 top-K 임계값에서 강하다(예: Hit@4000).
- Ablation 연구에서 Target Attention과 다값 Trigger가 검색 성능을 향상시키고, Trigger를 제거하거나 단값 Trigger를 사용하면 정확도가 감소한다.
- 파라미터 연구에서 Hit Rate 상승과 운영 효율성을 균형 있게 하는 최적의 IBS 자르기 크기(T=1250)를 식별했다.
- 사례 연구는 트리거 확률의 시간적 감소와 사용자 간 트리거 분포의 개인화를 보여준다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.