[論文レビュー] You Tweet What You Eat: Studying Food Consumption Through Twitter
本研究では、210,000人の米国ユーザーのTwitterデータを活用して、食事習慣を大規模に分析し、食品の言及を人口統計的要因、社会的要因、健康結果と関連付ける。投稿された食品のカロリー含量と州レベルの肥満率の間に0.77の強いピアソン相関が確認され、Twitterが国家的公衆衛生監視の予測的パワーを持つことが示された。
Food is an integral part of our lives, cultures, and well-being, and is of major interest to public health. The collection of daily nutritional data involves keeping detailed diaries or periodic surveys and is limited in scope and reach. Alternatively, social media is infamous for allowing its users to update the world on the minutiae of their daily lives, including their eating habits. In this work we examine the potential of Twitter to provide insight into US-wide dietary choices by linking the tweeted dining experiences of 210K users to their interests, demographics, and social networks. We validate our approach by relating the caloric values of the foods mentioned in the tweets to the state-wide obesity rates, achieving a Pearson correlation of 0.77 across the 50 US states and the District of Columbia. We then build a model to predict county-wide obesity and diabetes statistics based on a combination of demographic variables and food names mentioned on Twitter. Our results show significant improvement over previous CHI research (Culotta'14). We further link this data to societal and economic factors, such as education and income, illustrating that, for example, areas with higher education levels tweet about food that is significantly less caloric. Finally, we address the somewhat controversial issue of the social nature of obesity (first raised by Christakis & Fowler in 2007) by inducing two social networks using mentions and reciprocal following relationships.
研究の動機と目的
- Twitterデータが国家的食事行動および公衆衛生トレンドの代理指標として機能するかどうかを調査すること。
- 性別、教育水準、都市・地方居住などの人口統計的要因が、食品関連のツイートとどのように相関するかを検討すること。
- メンション関係および相互フォローリレーションシップを用いて、ソーシャルネットワークが食品消費行動に与える影響を評価すること。
- 実世界の健康統計(肥満率・糖尿病率など)と比較して、Twitterベースの食品言及の予測的パワーを検証すること。
提案手法
- 210,000人の米国在住Twitterユーザーから5億件のツイートを収集し、独自の食品語彙を用いて食品の言及を抽出した。
- 栄養データベースを活用して食品の言及をカロリー値にマッピングし、ツイートごとのカロリー密度を推定した。
- 2010年米国国勢調査の人口統計データ(性別(スクリーンネームから推定)、教育水準、都市・地方郵便番号分類)を統合した。
- ユーザーのメンションに基づくネットワークと、相互フォロー関係に基づくネットワークの2つのソーシャルネットワークを構築し、食品選択への社会的影響を分析した。
- 人口統計変数と食品言及を組み合わせた予測モデルを構築し、カントリー単位の肥満率・糖尿病率を予測した。
- 50州およびD.C.の州レベルの健康統計と予測値の間のピアソン相関を用いて、結果を検証した。
実験結果
リサーチクエスチョン
- RQ1Twitter上の食品言及は、州レベルの肥満率・糖尿病率を有意な相関で予測できるか?
- RQ2性別、教育水準、都市・地方居住などの人口統計的要因は、Twitter上で言及される食品のカロリー含量とどのように相関するか?
- RQ3メンションおよび相互フォローを介したソーシャルネットワーク構造が、Twitter上の食品関連行動にどの程度影響を及ぼすか?
- RQ4Twitterベースの食品語彙の予測性能は、LIWCなどの既存のツールと比較してどうか?
- RQ5ツイート内の食品言及は、日常の食事習慣を代表しているのか、それとも特別な機会や非摂取状況に偏っているのか?
主な発見
- 米国50州およびD.C.の州レベルの肥満率と、ツイート内で言及された食品の平均カロリー含量との間に、ピアソン相関係数0.77が確認された。
- 食品言及のカロリー密度と糖尿病率の間の相関は0.66であり、公衆衛生監視における強い予測可能性を示している。
- 女性は男性よりも著しくカロリー含量の低い食品についてツイートしていることが判明し、性別による食事の違いが示唆された。
- 教育水準が高い地域では、Twitter上で言及される食品のカロリー含量が統計的に有意に低減していた。
- 都市部のユーザーはアルコール飲料の言及が多めであった一方、地方部のユーザーはピザやチョコレートの言及がより頻繁であった。
- 料理に関心を示すと自己申告したユーザーは、肥満である可能性が1.5%低く、料理習慣と体重管理に関する先行研究と整合的であった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。