[论文解读] From Cookies to Cooks: Insights on Dietary Patterns via Analysis of Web Usage Logs
本文提出利用浏览器扩展插件收集的网络使用日志,将食谱搜索量作为食物摄入量的代理指标,推断全美国范围内的饮食模式。研究揭示了美国各地区饮食偏好的周周期与年周期规律,识别出用户尝试减重时的行为变化,且发现食谱中钠含量趋势与心力衰竭住院人数之间存在定性一致性。
Nutrition is a key factor in people's overall health. Hence, understanding the nature and dynamics of population-wide dietary preferences over time and space can be valuable in public health. To date, studies have leveraged small samples of participants via food intake logs or treatment data. We propose a complementary source of population data on nutrition obtained via Web logs. Our main contribution is a spatiotemporal analysis of population-wide dietary preferences through the lens of logs gathered by a widely distributed Web-browser add-on, using the access volume of recipes that users seek via search as a proxy for actual food consumption. We discover that variation in dietary preferences as expressed via recipe access has two main periodic components, one yearly and the other weekly, and that there exist characteristic regional differences in terms of diet within the United States. In a second study, we identify users who show evidence of having made an acute decision to lose weight. We characterize the shifts in interests that they express in their search queries and focus on changes in their recipe queries in particular. Last, we correlate nutritional time series obtained from recipe queries with time-aligned data on hospital admissions, aimed at understanding how behavioral data captured in Web logs might be harnessed to identify potential relationships between diet and acute health problems. In this preliminary study, we focus on patterns of sodium identified in recipes over time and patterns of admission for congestive heart failure, a chronic illness that can be exacerbated by increases in sodium intake.
研究动机与目标
- 利用匿名网络使用日志作为食物摄入量的代理指标,探索大规模饮食模式。
- 识别反映美国各地区和时间维度饮食偏好的食谱访问的时空差异。
- 检测急性饮食改变的行为指标,特别是尝试减重的用户群体。
- 探究在线食谱趋势(如钠含量)与真实世界健康结果(如住院人数)之间的潜在相关性。
- 评估使用网络日志进行公共卫生监测和针对性干预规划的可行性。
提出的方法
- 从广泛部署的浏览器扩展插件中收集匿名网络使用日志,以追踪食谱搜索和访问模式。
- 将食谱的访问量用作人群层面饮食兴趣和消费趋势的代理指标。
- 应用时空分析方法,检测美国各地区食谱访问中出现的周期性模式(周周期与年周期)。
- 识别购买自助减重指南的用户,作为其有意识改变饮食能力的代理指标。
- 追踪购买前后用户搜索查询的变化,特别是与食谱相关的查询,以检测行为转变。
- 将华盛顿特区食谱中钠含量的时间序列数据与心力衰竭急诊住院人数进行相关性分析。
实验结果
研究问题
- RQ1在全人群食谱访问中,哪些周期性模式(周周期与年周期)浮现,可能反映饮食偏好?
- RQ2美国不同地区的饮食模式在空间上如何变化?
- RQ3在有明确减重努力记录的用户中,其搜索行为(尤其是与食谱相关的查询)发生了哪些变化?
- RQ4是否存在可检测到的时间相关性,即访问食谱中钠含量上升与心力衰竭住院人数增加之间存在关联?
- RQ5网络使用日志能否作为实时、大规模的代理指标,用于监测营养趋势并支持公共卫生干预?
主要发现
- 食谱访问模式表现出强烈的周周期与年周期规律,尤其在感恩节和冬季节假日前后出现显著变化。
- 美国各地区的饮食差异明显,不同地理区域在营养偏好和食谱类型上呈现独特模式。
- 购买减重指南的用户在短期内立即转向更低热量和更健康的食谱搜索,但数周后逐渐回归原有饮食习惯。
- 观察到访问食谱中钠含量上升与华盛顿特区心力衰竭住院率上升之间存在定性一致性。
- 本研究证明,网络日志可作为可扩展的、实时的代理指标,用于监测人群层面的饮食趋势及其潜在健康影响。
- 研究结果表明,基于日志的分析可支持公共卫生机构设计针对性的、时间敏感的健康宣传和早期干预策略。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。