[論文レビュー] Recommender System for Online Dating Service
本稿では、情報過多を軽減し、マッチングの質を向上させるために、オンライン交際サービス向けに協調フィルタリング(CF)に基づくレコメンデーションシステムを提案する。Libimseti.cz から得た実世界のデータを用いて、ユーザー同士およびアイテム同士のCFアルゴリズムが、グローバルな人気(平均)およびランダムベースラインを著しく上回ることを示している。予測精度(NMAE:3.08% および 2.04%)が高く、盲検実験でもユーザーの好まれる傾向が強く、平均アルゴリズムに対して64.38%のデュエルで勝利した。
Users of online dating sites are facing information overload that requires them to manually construct queries and browse huge amount of matching user profiles. This becomes even more problematic for multimedia profiles. Although matchmaking is frequently cited as a typical application for recommender systems, there is a surprising lack of work published in this area. In this paper we describe a recommender system we implemented and perform a quantitative comparison of two collaborative filtering (CF) and two global algorithms. Results show that collaborative filtering recommenders significantly outperform global algorithms that are currently used by dating sites. A blind experiment with real users also confirmed that users prefer CF based recommendations to global popularity recommendations. Recommender systems show a great potential for online dating where they could improve the value of the service to users and improve monetization of the service.
研究の動機と目的
- ユーザーが劣悪なランク付けやクエリ制限のため、膨大なプロフィール閲覧に直面するオンライン交際における情報過多の問題に対処する。
- 協調フィルタリング(CF)とグローバル人気アルゴリズムを比較し、交際プロフィールの推薦効果を評価する。
- 実世界の環境において、CFベースの推薦とグローバルに人気のある推薦の間でのユーザーの好みを評価する。
- CFベースのレコメンデーションシステムが、マッチングの質とサービス価値を著しく向上させられることを実証する。
提案手法
- 本研究では、交際サイト Libimseti.cz から得た実世界のデータセットを用い、1,000件のプロフィールに対して14,057件の評価が行われ、スパarsityは11.39‰である。
- 4つのアルゴリズムをベンチマークとして比較:ランダム(一様なランダム予測)、平均(グローバル人気)、ユーザー同士CF(k近傍法)、アイテム同士CF(コサイン類似度ベース)。
- 予測精度は、正規化平均絶対誤差(NMAE)を用いて測定され、データセットのスナップショットを用いた交差検証が実施された。
- 111名の参加者を対象とした盲検ユーザー実験では、ユーザー同士CF(10,50)、平均、ランダムアルゴリズムの推薦リストを比較し、好みを評価するための「デュエル」形式が採用された。
- ユーザーインターフェースは、推薦が異性向けであることを保証し、すでに評価済みのプロフィールを除外することでバイアスを回避した。
- スケーラビリティを確認するため、インデックス構造の評価が行われ、ColFiが実世界のトラフィックレベルを処理できる能力を確認した。
実験結果
リサーチクエスチョン
- RQ1協調フィルタリングアルゴリズムは、オンライン交際においてグローバル人気ベースラインを著しく上回る推薦精度を達成できるか?
- RQ2ユーザーは、CFベースの推薦をグローバル人気またはランダムな推薦よりも高品質と認識するか?
- RQ3ユーザー同士およびアイテム同士のCFアルゴリズムは、NMAEの観点で平均およびランダムベースラインと比較してどの程度の性能を示すか?
- RQ4ユーザーインターフェース設計は、交際プラットフォームにおける評価の真実性および推薦品質にどのような影響を与えるか?
- RQ5ハイブリッドまたは相互マッチングモデルは、交際システムにおける推薦の関連性をさらに向上させられるか?
主な発見
- ユーザー同士CFは、NMAE 3.08% という最低値を記録し、アイテム同士CF(2.04%)およびグローバル平均アルゴリズムを上回った。
- アイテム同士CFアルゴリズムは、NMAE 2.04% という予測精度が最も高く、平均アルゴリズムの3.95%を著しく下回った。
- ユーザーの好み実験では、ユーザー同士CFが平均アルゴリズムに対して64.38%のデュエルで勝利し、CFベースの推薦に対する強いユーザーの好みが示された。
- 平均アルゴリズムは、ユーザー同士CFに対して35.62%のデュエルで勝利したが、全体では敗北した。これは、人気プロフィールに普遍的な好みがあるものの、依然としてCFが優勢であることを示している。
- ランダムアルゴリズムは非常に低く、ユーザー同士CFに対して87.50%のデュエルで敗北し、推薦ベースラインとしての無関係性が確認された。
- 本研究は、CFベースのレコメンデーションシステムが、精度の高さに加え、現実のユーザーに好まれることを確認しており、実際の交際プラットフォームへの導入を支持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。