[论文解读] You are What you Eat (and Drink): Identifying Cultural Boundaries by Analyzing Food & Drink Habits in Foursquare
本文提出一种数据驱动的方法,通过分析来自 Foursquare 的食物和饮料签到的时空数据,利用用户偏好的聚类来揭示国家、城市和城市区域之间的文化距离。该方法与基于传统调查的文化研究(如世界价值观调查)具有较强的皮尔逊相关性(ρ > 0.7),证明了其有效性与可扩展性,且仅需一周的真实用户数据即可实现。
Food and drink are two of the most basic needs of human beings. However, as society evolved, food and drink became also a strong cultural aspect, being able to describe strong differences among people. Traditional methods used to analyze cross-cultural differences are mainly based on surveys and, for this reason, they are very difficult to represent a significant statistical sample at a global scale. In this paper, we propose a new methodology to identify cultural boundaries and similarities across populations at different scales based on the analysis of Foursquare check-ins. This approach might be useful not only for economic purposes, but also to support existing and novel marketing and social applications. Our methodology consists of the following steps. First, we map food and drink related check-ins extracted from Foursquare into users' cultural preferences. Second, we identify particular individual preferences, such as the taste for a certain type of food or drink, e.g., pizza or sake, as well as temporal habits, such as the time and day of the week when an individual goes to a restaurant or a bar. Third, we show how to analyze this information to assess the cultural distance between two countries, cities or even areas of a city. Fourth, we apply a simple clustering technique, using this cultural distance measure, to draw cultural boundaries across countries, cities and regions.
研究动机与目标
- 开发一种可扩展、低成本的传统调查文化分析替代方法,用于识别文化边界。
- 探究基于位置的社交网络中食物和饮料签到模式是否能在全球和城市尺度上反映真实的文化差异。
- 评估 Foursquare 数据在复制大型调查(如世界价值观调查)中既定文化排名方面的有效性。
- 通过建模真实用户行为中的文化偏好,为市场营销、城市规划和个性化推荐系统等新应用提供支持。
提出的方法
- 利用时空特征将与食物和饮料相关的 Foursquare 签到映射到个体用户的文化偏好。
- 基于食物/饮料类型(如披萨、清酒)和时间模式(如周末访问)提取特征,以表征文化习惯。
- 通过聚合偏好向量的余弦相似度计算区域之间的文化距离。
- 应用 k-means 聚类根据文化距离对区域进行分组,可视化国家和城市的文化边界。
- 通过将本研究中国家相似性排名与世界价值观调查(WVS)的排名进行比较,使用斯皮尔曼等级相关系数进行结果验证。
- 使用两个数据集:一个包含所有食物/饮料特征,另一个仅包含周末快餐签到,以评估方法的鲁棒性。
实验结果
研究问题
- RQ1Foursquare 中的食物和饮料签到模式是否能可靠地反映大规模范围内的文化差异?
- RQ2基于用户签到的数据驱动方法与既定的调查文化排名之间的相关性如何?
- RQ3食物和饮料习惯中的时间与地理模式在多大程度上能揭示城市和国家内部的文化边界?
- RQ4聚焦特定数据子集(如周末快餐访问)是否能提高文化边界检测的准确性?
主要发现
- 使用完整特征数据时,该方法在15个国家中的9个与世界价值观调查排名达到统计显著的斯皮尔曼等级相关性(ρ > 0.7);使用周末快餐数据时,该数字上升至12个。
- 英国、法国、印度尼西亚、俄罗斯和西班牙在两个数据集中均表现出高相关性(ρ > 0.78),表明其与基于调查的文化排名高度一致。
- 该方法成功识别出与常识相符的文化边界,例如日本、韩国与西欧之间形成明显独立的聚类。
- 在多民族国家(如马来西亚和土耳其)中观察到负相关性,可能源于文化异质性以及数据中缺乏同质样本。
- 仅使用周末快餐签到(数据集2)的子集时,12个国家的相关性高于完整数据集,表明该子集对文化区分更具信息量。
- 该方法表明,仅用一周的 Foursquare 用户参与数据即可产生与四年期调查研究相当的结果,提供了一种更快、更便宜且可扩展的替代方案。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。