[論文レビュー] Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate
ESMMは全インプレッション空間でCTRとCTCVRを予測し、その積でCVRを導出することでポストクリックCVRを推定し、サンプル選択バイアスとデータのスパース性に対処しつつ、タスク間で埋め込みを共有する。Taobaoデータで基準モデルに対してCVR/CTCVRのAUCを大幅に改善する。
Estimating post-click conversion rate (CVR) accurately is crucial for ranking systems in industrial applications such as recommendation and advertising. Conventional CVR modeling applies popular deep learning methods and achieves state-of-the-art performance. However it encounters several task-specific problems in practice, making CVR modeling challenging. For example, conventional CVR models are trained with samples of clicked impressions while utilized to make inference on the entire space with samples of all impressions. This causes a sample selection bias problem. Besides, there exists an extreme data sparsity problem, making the model fitting rather difficult. In this paper, we model CVR in a brand-new perspective by making good use of sequential pattern of user actions, i.e., impression -> click -> conversion. The proposed Entire Space Multi-task Model (ESMM) can eliminate the two problems simultaneously by i) modeling CVR directly over the entire space, ii) employing a feature representation transfer learning strategy. Experiments on dataset gathered from Taobao's recommender system demonstrate that ESMM significantly outperforms competitive methods. We also release a sampling version of this dataset to enable future research. To the best of our knowledge, this is the first public dataset which contains samples with sequential dependence of click and conversion labels for CVR modeling.
研究の動機と目的
- 全空間で推定してCVRモデリングにおけるサンプル選択バイアスを解消する。
- より豊富なCTRデータから表現学習を移転させることでCVRのデータのスパース性を緩和する。
- インプレッション -> クリック -> コンバージョンという逐次的なユーザー行動パターンを活用してCVR推定を改善する。
- CTR、CVR、CTCVRを共同でモデル化するマルチタスクフレームワークを導入し、行動シーケンス全体で一貫した推論を可能にする。
提案手法
- CVR、CTR、およびCTCVRを埋め込み表現を共有する2つの主要サブネットワークとしてモデル化する。
- 全空間で直接pCTRとpCTCVRを予測する。pCVRはpCTRとpCTCVRの積から導出する(pCTCVR = pCTR * pCVR)。
- 全インプレッションに対して計算されるCTRとCTCVR項を含む結合損失で学習する(クリックのみサンプルに対するCVR損失はなし)。
- 豊富なCTRデータからの転移学習を可能にするため、CVRネットワークとCTRネットワーク間で埋め込みパラメータを共有する。
- DIVISION型のアプローチに伴う除法の数値的不安定性を回避するため、積形式を用いる。
- 任意で、CTCVR出力はCTRネットワーク出力とCVRネットワーク出力の積である。
実験結果
リサーチクエスチョン
- RQ1全ESMMは全空間でのモデリングによりCVRのサンプル選択バイアスを除去し得るか?
- RQ2CTRとCVRネットワーク間で埋め込みを共有し、逐次アクション情報を用いることでデータのスパース性の下でCVR推定を改善できるか?
- RQ3全インプレッション空間での予測性能という点で、ESMMは従来のCVRモデルや分割ベースのアプローチとどのように比較されるか?
- RQ4産業規模データにおけるCVRとCT-CVRタスクでのESMMの実証的な改善はどの程度か?
主な発見
| モデル | AUC on CVR task (mean ± std) | AUC on CTCVR task (mean ± std) |
|---|---|---|
| BASE | 66.00 ± 0.37 | 62.07 ± 0.45 |
| AMAN | 65.21 ± 0.59 | 63.53 ± 0.57 |
| OVERSAMPLING | 67.18 ± 0.32 | 63.05 ± 0.48 |
| UNBIAS | 66.65 ± 0.28 | 63.56 ± 0.70 |
| DIVISION | 67.56 ± 0.48 | 63.62 ± 0.09 |
| ESMM-NS | 68.25 ± 0.44 | 64.44 ± 0.62 |
| ESMM | 68.56 ± 0.37 | 65.32 ± 0.49 |
- ESMMは公開データセットにおいてCVRおよびCTCVRタスクでベースラインを大幅に上回り、特にCTCVRで最大の改善を示す。
- Public Datasetでは、ESMMはCVRで絶対AUC増分2.56%、CTCVRで3.25%をBASEに対して達成。
- ESMM-NS(共有埋め込み変種)はすでにBASEを上回っており、ESMMは逐次アクション構造と転移学習を活用してESMM-NSをさらに上回る。
- Product Dataset (8.9B samples) では、全データで学習した場合、サンプリング率を問わずCompetitorsを一貫して上回り、BASEに対してCVRで2.18%、CTCVRで2.32%の絶対AUC向上を得る。
- Dividing pCVR into pCTR and pCTCVR without joint training can cause numerical instability, which ESMM mitigates by using a multiplicative formulation.
- Using full-space training and embedding-sharing enables effective learning from abundant CTR data to alleviate CVR data sparsity.
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。