QUICK REVIEW

[论文解读] Personalised Travel Recommendation based on Location Co-occurrence

Maarten Clements, Pavel Serdyukov|arXiv (Cornell University)|Jun 26, 2011

Human Mobility and Location-Based Analysis参考文献 23被引用 32

一句话总结

本文提出了一种个性化旅游推荐系统，利用Flickr地理标签中的位置共现模式，为地理上偏远的地区推荐旅游景点。通过使用带尺度参数的高斯核密度估计建模用户访问共现模式，该方法生成用户特定的推荐结果，相较于基于热度的排序方法表现更优，尤其在按访问时长过滤后效果更显著，并通过余弦相似度和RankDiff排序方法实现跨大洲的意外发现式推荐。

ABSTRACT

We propose a new task of recommending touristic locations based on a user's visiting history in a geographically remote region. This can be used to plan a touristic visit to a new city or country, or by travel agencies to provide personalised travel deals. A set of geotags is used to compute a location similarity model between two different regions. The similarity between two landmarks is derived from the number of users that have visited both places, using a Gaussian density estimation of the co-occurrence space of location visits to cluster related geotags. The standard deviation of the kernel can be used as a scale parameter that determines the size of the recommended landmarks. A personalised recommendation based on the location similarity model is evaluated on city and country scale and is able to outperform a location ranking based on popularity. Especially when a tourist filter based on visit duration is enforced, the prediction can be accurately adapted to the preference of the user. An extensive evaluation based on manual annotations shows that more strict ranking methods like cosine similarity and a proposed RankDiff algorithm provide more serendipitous recommendations and are able to link similar locations on opposite sides of the world.

研究动机与目标

开发一种个性化旅游推荐系统，基于用户的访问历史，预测在地理上偏远区域的相关旅游景点。
利用Flickr的集体地理标签数据建模位置相似性，捕捉不同区域间用户访问的共现模式。
评估相似性模型在城市和国家尺度上推荐景点的有效性，尤其针对计划前往不熟悉目的地的用户。
对比不同排序方法（如余弦相似度和RankDiff）与基于热度的基线方法，在生成准确且意外发现式推荐方面的性能表现。
评估按访问时长和地理标签精度过滤用户数据对推荐质量与个性化程度的影响。

提出的方法

该方法在Flickr地理标签的6维共现空间上使用高斯核卷积来建模位置相似性，其中每个地理标签被视为一个狄拉克脉冲。
高斯核的标准差（带宽）作为尺度参数，控制推荐地标规模，从城市级到国家级推荐。
通过均值漂移算法近似共现模型中的峰值，以识别目标区域中最相关的地标。
通过核密度估计测量用户访问模式的重叠程度，计算两个区域（如柏林与巴塞罗那）之间位置的相似性。
应用余弦相似度和一种新型的RankDiff算法等排序方法，基于相似度得分对推荐结果进行优先排序，提升推荐的意外发现性。
使用人工标注评估推荐质量，重点过滤掉热门地标，以评估真正的个性化与新颖性。

实验结果

研究问题

RQ1从地理标签数据中提取的位置共现模式能否有效预测地理上偏远区域的个性化旅游推荐？
RQ2高斯核模型中的尺度参数（核带宽）如何影响推荐地标的规模与相关性？
RQ3与基于热度的基线方法相比，余弦相似度和RankDiff等排序方法在提升推荐意外发现性方面有多大的改善？
RQ4按访问时长或精度过滤地理标签是否能提升推荐的质量与个性化程度？
RQ5与完整的6维核卷积相比，共现模型中峰值位置的近似方法在准确性上如何？

主要发现

所提出的共现模型结合高斯核密度估计，在个性化旅游推荐中显著优于基于热度的排序方法，尤其在按访问时长过滤后表现更优。
RankDiff算法生成了稳定且高质量的推荐结果，在一致性和降低噪声引起的不相关性方面优于余弦相似度。
人工评估证实，更严格的排序方法能产生更具意外发现性的推荐，成功关联了柏林与巴塞罗那等遥远地区之间的相似地标。
共现模型中峰值位置的近似方法与完整6维卷积相比，平均偏差仅26米，平均振幅衰减2.4%，验证了其准确性。
按精度（街道级精度）过滤地理标签可提升模型可靠性，尽管损失了40%的数据，但模型可扩展以将地理标签精度作为高斯方差纳入。
该系统成功推荐了用户未访问过的城市或国家中的相关地标，展示了基于用户行为模式的跨大洲个性化推荐能力。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。