[論文レビュー] Personalised Travel Recommendation based on Location Co-occurrence
本稿では、Flickrの地理タグから得られる場所の共起パターンを活用して、地理的に遠隔な地域の観光地を個人に合わせた推薦を行う旅行推薦システムを提案する。スケールパラメータを用いたガウスカーネル密度推定を用いてユーザーの訪問共起をモデル化することで、訪問時間でフィルタリングされた状況においても、人気順ランキングを上回るユーザー固有の推薦を実現する。また、コサイン類似度とRankDiff順位付け手法を用いることで、偶然的かつ大陸を越えたおすすめを可能にする。
We propose a new task of recommending touristic locations based on a user's visiting history in a geographically remote region. This can be used to plan a touristic visit to a new city or country, or by travel agencies to provide personalised travel deals. A set of geotags is used to compute a location similarity model between two different regions. The similarity between two landmarks is derived from the number of users that have visited both places, using a Gaussian density estimation of the co-occurrence space of location visits to cluster related geotags. The standard deviation of the kernel can be used as a scale parameter that determines the size of the recommended landmarks. A personalised recommendation based on the location similarity model is evaluated on city and country scale and is able to outperform a location ranking based on popularity. Especially when a tourist filter based on visit duration is enforced, the prediction can be accurately adapted to the preference of the user. An extensive evaluation based on manual annotations shows that more strict ranking methods like cosine similarity and a proposed RankDiff algorithm provide more serendipitous recommendations and are able to link similar locations on opposite sides of the world.
研究の動機と目的
- ユーザーの訪問履歴に基づいて、地理的に遠隔な地域の関連する観光地を予測する、個人に合わせた旅行推薦システムの開発。
- Flickrの集団的地理タグデータを用いて、異なる地域におけるユーザー訪問の共起パターンを捉えることで、場所の類似性をモデル化すること。
- 特に、なじみのない目的地を計画中のユーザーに対して、都市規模および国規模での推薦の有効性を評価すること。
- コサイン類似度やRankDiffといった順位付け手法の性能を、人気順ベースラインと比較し、正確でかつ偶然的(serendipitous)な推薦を生成する能力を評価すること。
- 訪問時間や地理タグの正確性でユーザーデータをフィルタリングした場合の、推薦品質および個人化への影響を評価すること。
提案手法
- 本手法は、Flickrの地理タグの6次元共起空間にガウスカーネル畳み込みを適用し、場所の類似性をモデル化する。各地理タグはデルタ関数パulsesとして扱われる。
- ガウスカーネルの標準偏差(バンド幅)がスケールパラメータとして機能し、都市レベルから国レベルの推薦サイズを制御する。
- 共起モデルのピークは、メアンシフトアルゴリズムを用いて近似され、ターゲット地域における最も関連性の高いランドマークを特定する。
- ベルリンとバルセロナのような2地域間の場所類似度は、カーネル密度推定を用いてユーザー訪問パターンの重複度を測定することで計算される。
- コサイン類似度や新規のRankDiffアルゴリズムといった順位付け手法を適用し、類似度スコアに基づいて推薦を優先順位付けすることで、偶然性を高める。
- 手動アノテーションを用いて推薦品質を評価し、人気ランドマークを除外するフィルタリングに注力することで、真の個人化と新規性を評価する。
実験結果
リサーチクエスチョン
- RQ1地理的遠隔地域において、地理タグデータから抽出した場所の共起パターンは、個人に合わせた旅行推薦を効果的に予測できるか?
- RQ2ガウスカーネルモデルにおけるスケールパラメータ(バンド幅)は、推薦されるランドマークのサイズと関連性にどのように影響するか?
- RQ3コサイン類似度やRankDiffといった順位付け手法は、人気順ベースラインと比較して、推薦の偶然性(serendipity)をどの程度向上させるか?
- RQ4訪問時間や正確性で地理タグをフィルタリングすることで、推薦の品質および個人化が向上するか?
- RQ5共起モデルにおけるピーク位置の近似は、6次元カーネル畳み込みの完全な計算と比較してどの程度の誤差があるか?
主な発見
- ガウスカーネル密度推定を用いた提案された共起モデルは、訪問時間でフィルタリングされた状況においても、人気順ランキングを著しく上回る個人に合わせた旅行推薦を実現する。
- RankDiffアルゴリズムは安定的かつ高品質な推薦を生成し、一貫性とノイズに起因する不適切な類似性の低減において、コサイン類似度を上回る。
- 手動評価により、より制限的な順位付け手法がより偶然的(serendipitous)な推薦を生成することが確認され、ベルリンとバルセロナのような遠隔な地域間で類似したランドマークを結ぶことが可能になった。
- 共起モデルにおけるピーク位置の近似は、6次元カーネル畳み込みと比較して平均で26メートルのずれにとどまり、平均して2.4%の振幅減衰にとどまるため、その正確性が裏付けられた。
- 地理タグの正確性(ストリートレベルの精度)でフィルタリングすることでモデルの信頼性が向上するが、40%のデータが失われる。また、モデルは地理タグの正確性をガウス分散として組み込むことが可能である。
- 本システムは、訪問したことがない都市や国における関連するランドマークを効果的に推薦でき、ユーザー行動パターンに基づいた大陸を越えた個人化を実現した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。