QUICK REVIEW

[논문 리뷰] Scalable bundling via dense product embeddings

Madhav Kumar, Dean Eckles|ArXiv.org|2020. 01. 31.

Web Data Mining and Analysis참고 문헌 34인용 수 25

한 줄 요약

이 논문은 이커머스의 다중 카테고리 환경에서 확장 가능하고 데이터 기반의 번들링을 위해 기계학습 기반의 방법을 제안한다. 이는 역사적 구매 기록과 클릭스트림 데이터로부터 고밀도 제품 임베딩을 학습함으로써 이루어지며, 구매 및 검색 임베딩 내의 유사도를 보완성과 대체성에 대한 히ュ리스틱으로 사용한다. 번들 성능은 대규모 현장 실험을 통해 테스트되었으며, 임베딩 기반 히ュ리스틱이 다양한 카테고리에서 번들 성공을 안정적으로 예측함을 발견하였다. 이는 효율적이고 일반화 가능한 번들 설계를 가능하게 한다.

ABSTRACT

Bundling, the practice of jointly selling two or more products at a discount, is a widely used strategy in industry and a well examined concept in academia. Historically, the focus has been on theoretical studies in the context of monopolistic firms and assumed product relationships, e.g., complementarity in usage. We develop a new machine-learning-driven methodology for designing bundles in a large-scale, cross-category retail setting. We leverage historical purchases and consideration sets created from clickstream data to generate dense continuous representations of products called embeddings. We then put minimal structure on these embeddings and develop heuristics for complementarity and substitutability among products. Subsequently, we use the heuristics to create multiple bundles for each product and test their performance using a field experiment with a large retailer. We combine the results from the experiment with product embeddings using a hierarchical model that maps bundle features to their purchase likelihood, as measured by the add-to-cart rate. We find that our embeddings-based heuristics are strong predictors of bundle success, robust across product categories, and generalize well to the retailer's entire assortment.

연구 동기 및 목표

대규모 다중 카테고리 유통 환경에서 효과적인 프ом모션 번들을 설계하기 위한 경험적이고 확장 가능한 방법의 부족을 해결하기 위해.
사전에 정의된 보완성 또는 대체성 없이도 역사적 구매 및 브라우징 행동을 활용하여 제품 간 관계를 유추하는 데이터 기반 접근법을 개발하기 위해.
미국의 대규모 온라인 소매업체와의 현장 실험을 통해 임베딩 기반 히ュ리스틱의 번들 성공 예측 능력을 테스트하기 위해.
임베딩 유도 특징의 계층적 모델링을 통해 소매업체의 전체 제품 구성에 걸쳐 번들 성과 예측을 일반화하기 위해.
소비자의 다양성 탐색 행동을 자극하기 위해 불완전한 대체품을 사용한 '다양성 번들'의 잠재력을 탐색하기 위해.

제안 방법

표현 학습 접근법을 사용하여 역사적 구매 및 클릭스트림 데이터로부터 고밀도 연속형 제품 임베딩을 학습하기 위해.
구매 공간 임베딩 내의 유사도를 제품 보완성에 대한 히ュ리스틱으로, 검색 공간 임베딩 내의 유사도를 대체성에 대한 히ュ리스틱으로 사용하기 위해.
이러한 히ュ리스틱을 사용하여 각 제품별로 다수의 후보 번들을 생성하며, 불완전한 대체품을 포함한 다중 카테고리 번들 및 다양성 번들을 포함하기 위해.
추가 카트 비율을 결과 지표로 삼아, 미국의 대규모 온라인 소매업체와의 현장 실험을 수행하여 번들 성능을 측정하기 위해.
임베딩 기반 특징을 함수로 하는 번들 성공 가능성 모델링을 위해 제품 카테고리별로 변화하는 절편과 기울기를 가진 계층적 로지스틱 회귀를 적용하기 위해.
이 접근법을 전이 학습으로 프레임워크화하기 위해: 역사적 데이터(소스 작업)를 활용하여 현장 실험의 경험적 레이블링을 바탕으로 번들 선택(중점 작업)을 지원하기 위해.

실험 결과

연구 질문

RQ1구매 및 브라우징 행동에서 유도된 고밀도 제품 임베딩이 대규모 다중 카테고리 유통 환경에서 효과적인 프로모션 번들을 예측할 수 있는가?
RQ2보완성 및 대체성에 대한 임베딩 기반 히ュ리스틱이 번들 성공 예측에서 전통적인 이론 기반 가정보다 얼마나 우월한가?
RQ3임베딩 기반 번들 히ュ리스틱이 다양한 제품 카테고리와 전체 소매업체 제품 구성에 걸쳐 얼마나 일반화되는가?
RQ4불완전한 대체품으로 구성된 '다양성 번들'은 기존의 보완성 번들에 비해 얼마나 효과적인가?
RQ5제품 메타데이터 및 사전 처리 변수를 통제할 때, 임베딩에서 도출된 특징의 예측 능력은 어떠한가?

주요 결과

추가 카트 비율을 측정한 현장 실험에서, 보완성 및 대체성에 대한 임베딩 기반 히ュ리스틱이 번들 성공을 강력한 예측자로 나타냈다.
이 방법은 제품 카테고리 간에 강건하게 작동하였으며, 음료, 스낵, 세제 제품에서 다중 카테고리 번들링 잠재력이 높았다.
고기 및 수산물 제품은 통조림 식품과 신선 채소와 잘 어울리지만, 건강 관리 및 아기 용품은 다중 카테고리 번들링에 부적합한 편이었다.
계층적 로지스틱 회귀 모델은 임베딩 특징을 사용하여 소매업체의 전체 제품 구성에 걸쳐 번들 성과 예측을 성공적으로 일반화하였다.
이 방법은 조합적으로 큰 번들 공간을 효율적으로 필터링할 수 있었으며, 브루트 포스 방법에 비해 확연히 개선된 확장성을 보였다.
본 연구는 행동 데이터 기반으로 훈련된 기계학습 모델이 실제 유통 번들링에서 이론 기반 가정을 능가할 수 있음을 입증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.