Skip to main content
QUICK REVIEW

[논문 리뷰] You Tweet What You Eat: Studying Food Consumption Through Twitter

Sofiane Abbar, Yelena Mejova|arXiv (Cornell University)|2014. 12. 14.
Culinary Culture and Tourism참고 문헌 26인용 수 48
한 줄 요약

이 연구는 미국 사용자 210,000명의 트위터 데이터를 활용하여 식사 습관을 대규모로 분석하며, 음식 언급을 인구통계학적, 사회적, 건강 결과와 연관지웠다. 트윗된 음식의 칼로리 함량과 주 수준의 비만율 사이에 0.77의 강한 피어슨 상관관계를 발견하여 트위터가 국가 수준의 공중보건 모니터링에 예측 가능성을 지닌다는 것을 입증했다.

ABSTRACT

Food is an integral part of our lives, cultures, and well-being, and is of major interest to public health. The collection of daily nutritional data involves keeping detailed diaries or periodic surveys and is limited in scope and reach. Alternatively, social media is infamous for allowing its users to update the world on the minutiae of their daily lives, including their eating habits. In this work we examine the potential of Twitter to provide insight into US-wide dietary choices by linking the tweeted dining experiences of 210K users to their interests, demographics, and social networks. We validate our approach by relating the caloric values of the foods mentioned in the tweets to the state-wide obesity rates, achieving a Pearson correlation of 0.77 across the 50 US states and the District of Columbia. We then build a model to predict county-wide obesity and diabetes statistics based on a combination of demographic variables and food names mentioned on Twitter. Our results show significant improvement over previous CHI research (Culotta'14). We further link this data to societal and economic factors, such as education and income, illustrating that, for example, areas with higher education levels tweet about food that is significantly less caloric. Finally, we address the somewhat controversial issue of the social nature of obesity (first raised by Christakis & Fowler in 2007) by inducing two social networks using mentions and reciprocal following relationships.

연구 동기 및 목표

  • 트위터 데이터가 국가 수준의 식사 행동과 공중보건 추세를 대체로 활용할 수 있는지 조사하기 위해.
  • 성별, 교육 수준, 도시/농촌 거주 여부와 같은 인구통계적 요소가 음식 관련 트윗과 어떻게 관련되어 있는지 분석하기 위해.
  • 언급 및 상호 팔로우 관계를 통해 사회적 네트워크가 음식 소비 패턴에 미치는 영향을 평가하기 위해.
  • 실제 건강 통계인 비만 및 당뇨율과 같은 국가 수준의 건강 통계와의 비교를 통해 트위터 기반 음식 언급의 예측 능력을 검증하기 위해.

제안 방법

  • 210,000명의 미국 기반 트위터 사용자로부터 5억 200만 건의 트윗을 수집하고, 맞춤형 음식 어휘집을 사용해 음식 언급을 추출했다.
  • 영양 정보 데이터베이스를 활용해 음식 언급을 칼로리 값으로 매핑하여 트윗당 칼로리 밀도를 추정할 수 있도록 했다.
  • 성별(스크린 이름에서 유추), 교육 수준, 도시/농촌 우편번호 분류를 포함한 2010년 미국 인구 조사의 인구통계 데이터를 통합했다.
  • 사용자 언급 기반과 상호 팔로우 기반의 두 가지 사회적 네트워크를 구축하여 음식 선택에 대한 사회적 영향을 분석했다.
  • 인구통계 변수와 음식 언급을 조합한 예측 모델을 구축해 카운티 수준의 비만 및 당뇨율을 예측했다.
  • 미국 50개 주와 워싱턴 D.C. 전역에서 예측된 값과 실제 국가 수준의 건강 통계 간의 피어슨 상관관계를 사용해 결과를 검증했다.

실험 결과

연구 질문

  • RQ1트위터에서의 음식 언급이 미국 50개 주와 워싱턴 D.C.의 주 수준 비만 및 당뇨율을 유의미한 상관관계로 예측할 수 있는가?
  • RQ2성별, 교육 수준, 도시/농촌 거주 여부와 같은 인구통계적 요소가 트위터에서 언급된 음식의 칼로리 함량과 어떻게 관련되어 있는가?
  • RQ3언급 및 상호 팔로우를 통해 구축된 사회적 네트워크 구조가 트위터에서의 음식 관련 행동에 어느 정도의 영향을 미치는가?
  • RQ4트위터 기반 음식 어휘집의 예측 성능은 기존 도구인 LIWC와 비교해 어떻게 다른가?
  • RQ5트위터의 음식 언급은 일상적인 식사 습관을 대표하는가, 아니면 특별한 기념일이나 소비가 아닌 맥락으로 편향되어 있는가?

주요 결과

  • 미국 50개 주와 워싱턴 D.C. 전역에서 트윗된 음식의 평균 칼로리 함량과 주 수준의 비만율 사이에 0.77의 피어슨 상관관계가 발견되었다.
  • 음식 언급의 칼로리 밀도와 당뇨율 사이의 상관계수는 0.66로, 공중보건 모니터링에 강력한 예측 잠재력을 보였다.
  • 여성은 남성보다 칼로리 함량이 유의미하게 낮은 음식을 더 자주 트윗했으며, 이는 성별 기반의 식이 습관 차이를 시사했다.
  • 교육 수준이 높은 지역에서는 트위터에서 언급된 음식의 칼로리 함량이 통계적으로 유의미하게 감소했다.
  • 도시 거주자는 알코올 음료를 더 자주 언급한 반면, 농촌 거주자는 피자와 초콜릿을 더 자주 트윗했다.
  • 요리에 관심이 있다고 자신이 밝힌 사용자는 비만일 가능성이 1.5% 낮아졌으며, 이는 요리 습관과 체중 관리 간의 관계를 뒷받침하는 이전 연구 결과와 일치했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.