Skip to main content
QUICK REVIEW

[논문 리뷰] Training Deep AutoEncoders for Collaborative Filtering

Oleksii Kuchaiev, Boris Ginsburg|arXiv (Cornell University)|2017. 08. 05.
Music and Audio Processing참고 문헌 13인용 수 60
한 줄 요약

이 논문은 협업 필터링을 위해 매우 깊은 자동인코더를 학습시키고, Dense re-feeding과 SELU 활성화가 결합되어 Netflix 데이터에 대한 사전 훈련 없이도 미래 평가 예측에서 최첨단 성능을 달성합니다.

ABSTRACT

This paper proposes a novel model for the rating prediction task in recommender systems which significantly outperforms previous state-of-the art models on a time-split Netflix data set. Our model is based on deep autoencoder with 6 layers and is trained end-to-end without any layer-wise pre-training. We empirically demonstrate that: a) deep autoencoder models generalize much better than the shallow ones, b) non-linear activation functions with negative parts are crucial for training deep models, and c) heavy use of regularization techniques such as dropout is necessary to prevent over-fiting. We also propose a new training algorithm based on iterative output re-feeding to overcome natural sparseness of collaborate filtering. The new algorithm significantly speeds up training and improves model performance. Our code is available at https://github.com/NVIDIA/DeepRecommender

연구 동기 및 목표

  • 딥 자동인코더를 사용한 추천 시스템의 평점 예측 개선을 동기화한다.
  • CF에서 더 깊은 아키텍처가 얕은 아키텍처보다 일반화에 더 유리하다는 것을 보여준다.
  • 음의 부분을 가진 비선형 활성화와 강력한 정규화의 중요성을 제시한다.
  • 데이터 희소성을 해결하고 학습 속도를 높이기 위해 반복적 Dense Re-feeding을 도입한다.

제안 방법

  • 희소한 사용자 평점 벡터로부터 Dense 표현을 학습하기 위해 인코더-디코더 미러를 갖춘 심층 자동인코더를 사용한다.
  • 레이어별 사전 학습 없이 엔드투엔드로 학습한다.
  • SELU 활성화, 높은 드롭아웃, 제약된(연결된) 가중치를 사용해 과적합을 줄인다.
  • 희소 입력에서 Dense 학습 신호를 생성하기 위해 반복적 출력 재피딩을 도입한다.
  • 입력 벡터의 0을 무시하기 위해 마스킹된 평균 제곱 오차(MMSE)를 최적화한다.
  • 향상된 성능을 위해 더 높은 학습률과 재피딩을 결합한 실험 등 다양한 깊이, 드롭아웃, 학습 규정을 실험한다.

실험 결과

연구 질문

  • RQ1깊은 자동인코더 아키텍처가 협업 필터링에서 얕은 모델보다 미래 평점 예측을 개선할 수 있는가?
  • RQ2특히 음의 부분을 가진 활성화 함수가 심층 CF 자동인코더 학습에 어떤 영향을 미치는가?
  • RQ3일반화 및 수렴속도를 높이는 정규화 및 학습 전략들(예: 드롭아웃, 연결 가중치, Dense Re-feeding)은 무엇인가?
  • RQ4반복적 Dense Re-feeding이 더 높은 학습률로도 성능을 유지하거나 향상시키는가?

주요 결과

데이터세트I-ARU-ARRRNDeepRec
Netflix 3 months0.97780.98360.94270.9373
Netflix Full0.93640.96470.92240.9099
  • 더 깊은 자동인코더 아키텍처가 Netflix 데이터에서 얕은 모델에 비해 평가 RMSE를 개선한다.
  • 음의 부분이 0이 아니고 음수 영역을 가지며 양의 부분은 제한되지 않는 활성화 함수(SELU 포함)가 이 작업에서 Sigmoid, ReLU, Tanh보다 더 나은 성능을 보인다.
  • 코딩 레이어에서의 높은 드롭아웃(예: 0.8)은 과적합을 방지하고 일반화를 향상시킨다.
  • 반복적 Dense Re-feeding과 더 높은 학습률의 조합이 기본 학습에 비해 성능을 크게 향상시킨다.
  • Netflix Full에서의 Best DeepRec 모델은 실험에서 테스트 RMSE가 0.9099에 도달하여 I-AR, U-AR, RRN 등의 기존 방법보다 우수한 성능을 보인다.
  • 적절한 규제화를 갖춘 더 깊은 모델은 평가 데이터에서 미래 평점 예측에 대해 시계열 동적 방법을 능가할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.