[논문 리뷰] Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
이 논문은 추천 시스템에서 트리 기반 인덱스 구조와 딥 사용자 선호 모델을 함께 훈련하는 통합 프레임워크인 공동 트리 최적화(JTM)를 제안한다. 계층적 사용자 표현을 공유 목표 함수 하에 두 구성 요소를 함께 최적화함으로써 JTM은 추천 정확도와 효율성에서 뚜렷한 향상을 이룩하였으며, 대규모 디스プレイ 광고 플랫폼에서의 온라인 A/B 테스트에서 CTR가 11.3% 향상되고 RPM이 12.9% 향상되었다.
Large-scale industrial recommender systems are usually confronted with computational problems due to the enormous corpus size. To retrieve and recommend the most relevant items to users under response time limits, resorting to an efficient index structure is an effective and practical solution. The previous work Tree-based Deep Model (TDM) \cite{zhu2018learning} greatly improves recommendation accuracy using tree index. By indexing items in a tree hierarchy and training a user-node preference prediction model satisfying a max-heap like property in the tree, TDM provides logarithmic computational complexity w.r.t. the corpus size, enabling the use of arbitrary advanced models in candidate retrieval and recommendation. In tree-based recommendation methods, the quality of both the tree index and the user-node preference prediction model determines the recommendation accuracy for the most part. We argue that the learning of tree index and preference model has interdependence. Our purpose, in this paper, is to develop a method to jointly learn the index structure and user preference prediction model. In our proposed joint optimization framework, the learning of index and user preference prediction model are carried out under a unified performance measure. Besides, we come up with a novel hierarchical user preference representation utilizing the tree index hierarchy. Experimental evaluations with two large-scale real-world datasets show that the proposed method improves recommendation accuracy significantly. Online A/B test results at a display advertising platform also demonstrate the effectiveness of the proposed method in production environments.
연구 동기 및 목표
- 대규모 추천 시스템에서 트리 인덱스와 사용자 선호 모델의 분리된 훈련으로 인한 최적 성능 이하의 성능을 해결하기 위해.
- 단일 성능 지표 하에 트리 인덱스 구조와 딥 사용자 선호 모델의 최적화를 통합하기 위해.
- 트리 인덱스 구조를 활용하여 향상된 모델 훈련을 위한 계층적 사용자 표현을 개발하기 위해.
- 내적 곱 제약 조건 없이 임의의 고급 딥 러닝 모델을 후보 검색에 사용할 수 있도록 하기 위해.
- 공동 학습을 통해 실세계 산업 시스템에서 추천 정확도와 효율성을 향상시키기 위해.
제안 방법
- 통합 글로벌 손실 함수 하에 트리 인덱스와 사용자 선호 모델을 번갈아가며 업데이트하는 공동 최적화 프레임워크를 제안한다.
- 트리 인덱스의 여러 수준에서 사용자 선호도를 인코딩하는 계층적 사용자 표현을 도입한다.
- 예측된 사용자-노드 선호도를 사용하여 계층적으로 트리 인덱스를 단계별로 탐색하는 비트 서치 전략을 적용한다.
- 구조적 변화를 반복할 때마다 줄이는 레이지 업데이트 전략을 트리 학습에 활용하여 수렴 안정성을 향상시킨다.
- 트리의 최대 힙 성질을 활용한다: 각 노드의 선호도는 자식 노드들의 선호도의 최댓값이며, 이로 인해 로그 시간 복잡도를 달성할 수 있다.
- 반복적인 공동 학습을 적용하여 예측 목표에서의 피드백에 기반해 트리 구조와 모델 파라미터를 함께 개선한다.
실험 결과
연구 질문
- RQ1트리 인덱스와 딥 모델의 공동 최적화가 별도 훈련 대비 추천 정확도 향상에 기여하는가?
- RQ2인덱스와 모델 학습을 통합한 단일 목적 함수가 더 나은 수렴과 성능을 이끌어내는가?
- RQ3트리 구조에서 파생된 계층적 사용자 표현이 모델 일반화 및 검색 품질 향상에 기여하는가?
- RQ4대규모 산업 데이터를 가진 실세계 생산 환경에서 공동 학습 프레임워크의 성능은 어떠한가?
- RQ5제안된 방법이 TDM 및 Item-CF와 같은 기존 베이스라인보다 오프라인 지표와 온라인 KPI 모두에서 뛰어난 성능을 보이는가?
주요 결과
- JTM은 타오바오의 디스플레이 광고 플랫폼에서 실시한 온라인 A/B 테스트에서 베이스라인 대비 클릭률(CTR)이 11.3% 상승하였다.
- JTM은 수익 per mille(RPM)을 12.9% 향상시켜 실전 환경에서 더 강력한 비즈니스 영향을 보였다.
- 공동 학습 프레임워크는 안정적으로 수렴하며, 결국 과적합되는 클러스터링 기반 트리 학습 방법보다 뛰어난 성능을 보였다.
- 아마존 북스 및 유저행동 데이터셋에서 JTM은 모든 지표에서 정밀도, 재현율, F1-측정치를 일관되게 향상시켰다.
- 제안된 계층적 사용자 표현과 공동 최적화가 더 나은 일반화와 더 정확한 선호도 예측을 이끌어냈다.
- 이 방법은 내적 곱 제약 조건 없이도 임의의 딥 러닝 모델을 후보 검색에 사용할 수 있도록 하여 모델의 유연성을 확장시켰다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.