[論文レビュー] Sentiment in New York City: A High Resolution Spatial and Temporal View
本研究では、地理的に位置指定されたツイッター投稿データと独自の絵文字ベースのセンチメント分類器を用いて、ニューヨーク市における公共の感情をマッピングした。その結果、感情は公園で最も高く、交通ハブで最も低く、深夜にピークに達し、週末にかけても高い傾向を示す、明確な日次および週次パターンが明らかになった。この手法により、言語固有の語彙集に依存せずに、都市の気分の高分解像の時空間的分析が可能となった。
Measuring public sentiment is a key task for researchers and policymakers alike. The explosion of available social media data allows for a more time-sensitive and geographically specific analysis than ever before. In this paper we analyze data from the micro-blogging site Twitter and generate a sentiment map of New York City. We develop a classifier specifically tuned for 140-character Twitter messages, or tweets, using key words, phrases and emoticons to determine the mood of each tweet. This method, combined with geotagging provided by users, enables us to gauge public sentiment on extremely fine-grained spatial and temporal scales. We find that public mood is generally highest in public parks and lowest at transportation hubs, and locate other areas of strong sentiment such as cemeteries, medical centers, a jail, and a sewage facility. Sentiment progressively improves with proximity to Times Square. Periodic patterns of sentiment fluctuate on both a daily and a weekly scale: more positive tweets are posted on weekends than on weekdays, with a daily peak in sentiment around midnight and a nadir between 9:00 a.m. and noon.
研究の動機と目的
- ソーシャルメディアデータを用いて、ニューヨーク市における公共の感情の高分解像の空間的・時間的視覚化を実現すること。
- 外部語彙集に依存せずに、140文字以内のツイッター投稿に特化したセンチメント分類器を構築すること。
- 公園、交通ハブ、医療施設を含む都市環境における感情の地理的および時間的パターンを同定すること。
- 都市環境におけるリアルタイムで細分化されたセンチメント分析にツイッターを用いる可能性を評価すること。
- デジタルトレースデータを通じて、都市インフラと集団的感情状態の関係を探索すること。
提案手法
- 2012年4月13日から26日までの間、40°から41°N、73°から74°Wの境界ボックスを用いて、ツイッターのストリーミングAPIを介して603,954件の地理的位置指定付きツイートを収集した。
- 肯定的および否定的絵文字を訓練ラベルとして用い、教師あり学習の基盤とする、バイナリセンチメント分類器を構築した。
- URLとユーザーネームをそれぞれ'URL'と'USER'に置換し、残りのテキストをトークン化することで、ツイートを標準化した。
- 各ツイートの固有トークンから得た特徴量を用いて、肯定的および否定的センチメントの2つのナイーブベイズ分類器を適用した。
- 式:(p₁ + (1 − p₂)) / 2 を用いて複合センチメントスコアを計算した。ここで、p₁は肯定的センチメントの確率、p₂は否定的センチメントの確率である。
- センチメントスコアをセンサスブロックレベルの空間ユニットにマッピングし、シアンが高正の感情、マゼンタが低正の感情を示すカラーマップとして可視化した。
実験結果
リサーチクエスチョン
- RQ1ニューヨーク市において、公共の感情が最も高く・最も低い地域はどこであり、それらの極端な地域と関連する都市的特徴は何か?
- RQ2公共の感情は1日の中の時間帯や週の曜日によってどのように変化するか?
- RQ3タイムズスクエアへの距離が周辺地域の全体的な感情レベルにどの程度影響を及えるか?
- RQ4交通ハブ、墓地、下水処理施設などの特定の都市インフラは、ソーシャルメディアに反映された集団的気分にどのように影響を与えるか?
- RQ5絵文字ベースのセンチメント分類は、言語に依存しない信頼性の高い方法として、短いフォーマットのソーシャルメディア投稿の感情分析に有効に機能するか?
主な発見
- 公共の感情は都市の公園で最も高く、セントラル・パークでは明確な高正の帯が観察された。一方、ペン・ステーション、ブルックリン・ブリッジ、ミッドタウン・トンネルなどの交通ハブで最も低かった。
- 感情は午前0時頃にピークに達し、午前9時から正午にかけて谷に達する。午後から夕方への移行に伴い、特に退勤後から一貫して上昇する傾向を示した。
- 週末の感情は平日よりも一貫して肯定的であり、同様の日次パターンを示すが、全体的な肯定的水準が高かった。
- タイムズスクエアからの距離が0 kmから10 kmに増加するに従い、肯定的ツイートの割合は0.74から0.60に減少し、タイムズスクエアを中心とした明確な感情の空間的勾配が確認された。
- パラサイドズやウィーハーケンの墓地、マスペス・クリークの下水処理施設は強い否定的センチメントを示しており、臭気や環境的懸念が原因とされる。
- リケルズ島、マイモニデス病院やルーテル病院などの医療施設、空港も強い否定的または混合の感情を示しており、施設的または環境的ストレス要因が関係しているとされる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。