Skip to main content
QUICK REVIEW

[論文レビュー] You are What you Eat (and Drink): Identifying Cultural Boundaries by Analyzing Food & Drink Habits in Foursquare

Thiago H. Silva, Pedro O. S. Vaz de Melo|arXiv (Cornell University)|Apr 3, 2014
Wine Industry and Tourism被引用数 47
ひとこと要約

本稿では、Foursquare における空間的・時間的飲食物チェックインデータを分析することで、ユーザーの好みのクラスタリングを用いて、国、都市、都市圏における文化的な境界を特定するデータ駆動型手法を提案する。この手法は、世界価値観調査(WVS)のような従来の調査ベースの文化的研究と強く相関(ρ > 0.7)しており、1週間分の実世界ユーザーデータのみを用いても有効性とスケーラビリティを示している。

ABSTRACT

Food and drink are two of the most basic needs of human beings. However, as society evolved, food and drink became also a strong cultural aspect, being able to describe strong differences among people. Traditional methods used to analyze cross-cultural differences are mainly based on surveys and, for this reason, they are very difficult to represent a significant statistical sample at a global scale. In this paper, we propose a new methodology to identify cultural boundaries and similarities across populations at different scales based on the analysis of Foursquare check-ins. This approach might be useful not only for economic purposes, but also to support existing and novel marketing and social applications. Our methodology consists of the following steps. First, we map food and drink related check-ins extracted from Foursquare into users' cultural preferences. Second, we identify particular individual preferences, such as the taste for a certain type of food or drink, e.g., pizza or sake, as well as temporal habits, such as the time and day of the week when an individual goes to a restaurant or a bar. Third, we show how to analyze this information to assess the cultural distance between two countries, cities or even areas of a city. Fourth, we apply a simple clustering technique, using this cultural distance measure, to draw cultural boundaries across countries, cities and regions.

研究の動機と目的

  • 文化的境界を特定するための、従来のアンケートベースの文化的分析に代わるスケーラブルで低コストな代替手法の開発。
  • 位置ベースのソーシャルネットワークにおける飲食物のチェックインパターンが、グローバルおよび都市スケールで実際の文化的差を反映しているかどうかを調査すること。
  • Foursquare データが、世界価値観調査(WVS)のような大規模アンケートから得られる既存の文化的順位をどれだけ正確に再現できるかを評価すること。
  • 実際のユーザー行動に基づく文化的好みのモデリングを通じて、マーケティング、都市計画、パーソナライズド推薦システムの新たな応用を可能にすること。

提案手法

  • 空間的・時間的特徴を用いて、Foursquare の飲食物関連チェックインを個々のユーザーの文化的好みに関連付ける。
  • たとえばピザやサケといった飲食物の種別や、週末の訪問といった時間的パターンに基づく特徴を抽出し、文化的な習慣を表現する。
  • 集約された好みベクトル間のコサイン類似度を用いて、地域間の文化的距離を計算する。
  • k-means クラスタリングを適用して、文化的距離に基づき地域をグループ化し、国や都市における文化的境界を可視化する。
  • スピアマン順位相関を用いて、世界価値観調査(WVS)の順位と照合することで、結果の妥当性を検証する。
  • 2つのデータセットを用いる:1つはすべての飲食物特徴を含み、もう1つは週末のファストフードチェックインのみを対象とし、結果の頑健性を評価する。

実験結果

リサーチクエスチョン

  • RQ1Foursquare における飲食物のチェックインパターンは、スケールを考慮した文化的差を信頼性を持って反映できるか?
  • RQ2ユーザーのチェックインに基づくデータ駆動型アプローチは、確立されたアンケートベースの文化的順位とどの程度相関するか?
  • RQ3飲食物の習慣における時間的・地理的パターンは、国や都市内における文化的境界をどの程度明らかにできるか?
  • RQ4特定のデータサブセット(例:週末のファストフード訪問)に焦点を当てることで、文化的境界の検出精度が向上するか?

主な発見

  • 提案手法は、全特徴データを用いた場合、15カ国のうち9カ国で統計的に有意なスピアマン順位相関(ρ > 0.7)を達成し、週末ファストフードデータでは12カ国で同様の相関を示した。
  • イギリス、フランス、インドネシア、ロシア、スペインでは、両データセットで高い相関(ρ > 0.78)を示し、アンケートベースの文化的順位と強く一致している。
  • 本手法は、日本、韓国、西ヨーロッパの明確なクラスタを特定し、一般的な知識と整合する文化的境界を成功裏に同定した。
  • マレーシア や タイ のような多文化国家では、文化的多様性とデータ内での均一なサンプルの欠如のため、負の相関が観察された。
  • 週末のファストフードチェックインのみを対象としたデータセット(データセット2)は、12カ国の相関が全データよりも高かった。これは、このサブセットが文化的差別の検出により情報量が多いことを示唆している。
  • 本手法は、1週間分の Foursquare ユーザー参加データのみで、4年間のアンケート調査と同等の結果を達成できることを示しており、より速く、安価でスケーラブルな代替手段であることが明らかになった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。