Skip to main content
QUICK REVIEW

[논문 리뷰] Recommendation as Instruction Following: A Large Language Model Empowered Recommendation Approach

Junjie Zhang, Ruobing Xie|arXiv (Cornell University)|2023. 05. 11.
Topic Modeling인용 수 25
한 줄 요약

본 논문은 InstructRec를 제안하는데, 이는 추천을 지시사항 이행으로 간주하는 추천 시스템으로, 3B Flan-T5-XL LLM을 미세조정하고, 개인화 및 일반화를 향상시키기 위해 사용자 중심의 대규모 자연어 지시문을 활용합니다.

ABSTRACT

In the past decades, recommender systems have attracted much attention in both research and industry communities, and a large number of studies have been devoted to developing effective recommendation models. Basically speaking, these models mainly learn the underlying user preference from historical behavior data, and then estimate the user-item matching relationships for recommendations. Inspired by the recent progress on large language models (LLMs), we take a different approach to developing the recommendation models, considering recommendation as instruction following by LLMs. The key idea is that the preferences or needs of a user can be expressed in natural language descriptions (called instructions), so that LLMs can understand and further execute the instruction for fulfilling the recommendation task. Instead of using public APIs of LLMs, we instruction tune an open-source LLM (3B Flan-T5-XL), in order to better adapt LLMs to recommender systems. For this purpose, we first design a general instruction format for describing the preference, intention, task form and context of a user in natural language. Then we manually design 39 instruction templates and automatically generate a large amount of user-personalized instruction data (252K instructions) with varying types of preferences and intentions. To demonstrate the effectiveness of our approach, we instantiate the instruction templates into several widely-studied recommendation (or search) tasks, and conduct extensive experiments on these tasks with real-world datasets. Experiment results show that the proposed approach can outperform several competitive baselines, including the powerful GPT-3.5, on these evaluation tasks. Our approach sheds light on developing more user-friendly recommender systems, in which users can freely communicate with the system and obtain more accurate recommendations via natural language instructions.

연구 동기 및 목표

  • LLMs로서의 추천을 지시 이행으로 다루는 concept를 소개한다.
  • 사용자 선호도, 의도, 작업 형식, 컨텍스트를 포착하는 유연한 지시 형식을 설계한다.
  • LLM을 추천 작업에 맞춰 미세조정하기 위해 대규모의 고품질 지시 데이터 세트를 생성한다.
  • 실세계 데이터셋과 작업에서 InstructRec의 효과와 일반화를 입증한다.

제안 방법

  • 선호도, 의도, 작업 형식, 컨텍스트를 포함하는 추천을 위한 통합 지시 형식을 정의한다.
  • 수동으로 39개의 거친 수준의 지시 템플릿을 설계하고 GPT-3.5를 교사-LLM으로 사용하여 252K개의 정교하게 세밀한 사용자 지시를 자동으로 생성한다.
  • 지시 데이터로 3B Flan-T5-XL 모델을 미세조정하여 추천에 대한 지시 이행을 가능하게 한다.
  • 훈련된 LLM을 reranker로 사용하여 후보 세트에서 최종 아이템 순위를 생성한다.
  • 지시 다양성을 증가시키는 전략(예: 입력-출력 전환, CoT 추론)과 사용자 요구와의 정렬을 보장하는 전략을 제공한다.
Figure 1 . A framework of our proposed InstructRec.
Figure 1 . A framework of our proposed InstructRec.

실험 결과

연구 질문

  • RQ1추천 작업을 LLM의 지시 이행으로 효과적으로 형상화할 수 있는가?
  • RQ2지시 형식, 데이터 생성 및 튜닝이 추천 품질과 일반화에 어떤 영향을 미치는가?
  • RQ3InstructRec가 베이스라인을 능가하고 보지 않은 도메인/지시로 일반화되는가?
  • RQ4지시 다양성이 모델 성능에 미치는 영향은 무엇인가?

주요 결과

  • InstructRec는 GPT-3.5를 포함한 여러 경쟁 베이스라인보다 평가 작업에서 우수한 성능을 보여줄 수 있다.
  • 이 방법은 다양한 사용자의 요구를 수용하는 LLM의 능력을 향상시키고 보유된 지시 및 도메인에 대해 더 나은 일반화를 보인다.
  • 252K개의 대규모 고품질 지시 데이터 세트가 추천 시스템에 대한 효과적인 지시 미세조정을 지원한다.
  • 지시 형식은 사용자 선호도, 의도, 작업 형식, 컨텍스트를 효과적으로 포착하여 추천을 안내한다.
  • 지시 다양성을 강화하고 CoT와 같은 추론을 도입하면 성능이 더 향상될 수 있다.
Figure 2 . Various types of key aspects in instructions.
Figure 2 . Various types of key aspects in instructions.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.