Skip to main content
QUICK REVIEW

[논문 리뷰] M6-Rec: Generative Pretrained Language Models are Open-Ended Recommender Systems

Zeyu Cui, Jianxin Ma|arXiv (Cornell University)|2022. 05. 17.
Topic Modeling인용 수 24
한 줄 요약

본 논문은 M6-Rec를 제시합니다. 이는 태스크를 언어 이해/생성으로 변환하는 오픈 엔드(Open-ended) 기초 모델이며, 클라우드와 엣지 디바이스 모두를 위한 효율적인 적응 및 배포 기법을 소개합니다.

ABSTRACT

Industrial recommender systems have been growing increasingly complex, may involve \emph{diverse domains} such as e-commerce products and user-generated contents, and can comprise \emph{a myriad of tasks} such as retrieval, ranking, explanation generation, and even AI-assisted content production. The mainstream approach so far is to develop individual algorithms for each domain and each task. In this paper, we explore the possibility of developing a unified foundation model to support \emph{open-ended domains and tasks} in an industrial recommender system, which may reduce the demand on downstream settings' data and can minimize the carbon footprint by avoiding training a separate model from scratch for every task. Deriving a unified foundation is challenging due to (i) the potentially unlimited set of downstream domains and tasks, and (ii) the real-world systems' emphasis on computational efficiency. We thus build our foundation upon M6, an existing large-scale industrial pretrained language model similar to GPT-3 and T5, and leverage M6's pretrained ability for sample-efficient downstream adaptation, by representing user behavior data as plain texts and converting the tasks to either language understanding or generation. To deal with a tight hardware budget, we propose an improved version of prompt tuning that outperforms fine-tuning with negligible 1\% task-specific parameters, and employ techniques such as late interaction, early exiting, parameter sharing, and pruning to further reduce the inference time and the model size. We demonstrate the foundation model's versatility on a wide range of tasks such as retrieval, ranking, zero-shot recommendation, explanation generation, personalized content creation, and conversational recommendation, and manage to deploy it on both cloud servers and mobile devices.

연구 동기 및 목표

  • 다수의 도메인과 업무에 걸친 산업용 추천 시스템을 위한 통합된 기초 모델의 동기를 제시한다.
  • 아이템 ID 없이도 언어 모델 기반 행동 데이터가 샘플 효율적인 다운스트림 적응을 지원할 수 있음을 보인다.
  • 클라우드 및 모바일 기기 배치를 위한 실용적 효율 기법들(option tuning, late interaction, pruning, quantization, early exiting)을 시연한다.
  • 검색, 랭킹, 설명 생성, 개인화된 콘텐츠 생성, 대화형 추천과 같은 제로샷, few-shot 및 생성 가능 작업을 검증한다.

제안 방법

  • 사용자 행동 데이터를 일반 텍스트로 표현하고 작업을 언어 이해 또는 생성을 위해 변환함으로써 M6 사전학습 언어모델을 M6-Rec로 확장한다.
  • 대부분의 파라미터를 고정하고 소수의 소프트 프롬프트만 조정하는 프롬프트 튜닝의 효율적 변형인 option tuning을 도입한다.
  • 저지연 추론을 위해 초기 레이어를 미리 계산하고 마지막 레이어 상호작용을 수행하는 multi-segment late interaction을 채택한다.
  • 프롬프트 튜닝과 파인튜닝을 더 연결하기 위해 FFN 레이어를 갖는 어댑터를 도입한다(옵션-어댑터 튜닝).
  • 가변 하드웨어 예산에 맞춰 M6-Edge로의 증류를 통한 엣지 기기용 모델 압축 후 가지치기(pruning), 양자화(quantization), 조기 종료(early exiting)를 수행한다.
  • 검색을 위한 128-dim 벡터 및 kNN 검색으로 사용자와 아이템 표현을 정렬하기 위한 대조 학습을 사용한다.
  • 설명 가능한 추천, 개인화된 디자인, 검색 질의 생성, 대화 설정에 대한 생성 형식을 정의한다.

실험 결과

연구 질문

  • RQ1하나의 단일 기초 모델이 산업용 추천 시스템의 오픈 엔드 도메인과 태스크를 지원할 수 있는가?
  • RQ2사용자 행동의 텍스트 기반 표현이 검색, 랭킹, 생성, 대화와 같은 태스크 전반에서 효과적인 제로샷 및 퍽샷 학습을 가능하게 하는가?
  • RQ3프롬프트 기반 및 어댑터 기반의 파라메터 효율적 튜닝이 최소한의 태스크 특화 파라미터로도 경쟁력 있는 성능을 달성할 수 있는가?
  • RQ4레이턴트 인터랙션(late interaction), 가지치기(pruning), 양자화(quantization), 조기 종료(early exiting)와 같은 배포 전략이 지연 시간이나 정확도를 해치지 않으면서 클라우드-엣지 배포를 가능하게 하는가?
  • RQ5설명, 개인화된 디자인, 대화형 추천과 같은 생성 태스크를 하나의 통합 모델이 얼마나 잘 처리하는가?

주요 결과

  • M6-Rec은 제로/퓨샷 학습을 지원하고 검색(retrieval)에서 랭킹(ranking), 생성(generation), 대화형 추천(conversational recommendation)에 이르는 다양한 태스크를 수행한다.
  • Option tuning은 표준 파인 튜닝보다 우수한 성능을 보이며 파라미터의 일부만 조정하는 경우에 특히 어댑터(option-adapter tuning)와 결합될 때 더 우수하다.
  • 다중 세그먼트 late interaction은 초기 트랜스포머 레이어를 미리 계산하고 세그먼트 결과를 캐시하여 저지연 추론을 가능하게 한다.
  • M6-Edge를 이용한 엣지 배포는 포스트 증류(post-distillation), 가지치기(pruning), 8-bit 양자화 이후에도 경쟁력 있는 성능으로 300M에서 최저 2M 파라미터로 상당한 모델 크기 축소를 달성한다.
  • 텍스트 기반 행동 모델링은 오픈 도메인 추천을 가능하게 하여 아이템 IDs 의존성을 줄이고 설명 가능한 추천 및 개인화 콘텐츠 생성과 같은 생성 태스크를 가능하게 한다.
  • 이 접근법은 클라우드 서버와 엣지 기기 모두에서의 배포를 보여주며 검색, CTR 예측, 생성 태스크에서 측정 가능한 이점을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.