[論文レビュー] Understanding and Measuring Psychological Stress using Social Media
本研究では、601名のユーザーから得られたFacebookおよびTwitterのデータと、基準となるペルセイブド・ストレススケール(PSS)スコアを用いて、ソーシャルメディアからの心理的ストレスを予測する言語モデルの開発と検証を行った。Facebookの言語的特徴がTwitterよりもストレスの予測に優れていることが示され、ドメイン適応技術を用いてユーザー単位のモデルを郡レベルの予測に適応させた結果、個別および地域レベルのストレス推定において、社会的・文化的要因よりも優れた性能を示した。
A body of literature has demonstrated that users' mental health conditions, such as depression and anxiety, can be predicted from their social media language. There is still a gap in the scientific understanding of how psychological stress is expressed on social media. Stress is one of the primary underlying causes and correlates of chronic physical illnesses and mental health conditions. In this paper, we explore the language of psychological stress with a dataset of 601 social media users, who answered the Perceived Stress Scale questionnaire and also consented to share their Facebook and Twitter data. Firstly, we find that stressed users post about exhaustion, losing control, increased self-focus and physical pain as compared to posts about breakfast, family-time, and travel by users who are not stressed. Secondly, we find that Facebook language is more predictive of stress than Twitter language. Thirdly, we demonstrate how the language based models thus developed can be adapted and be scaled to measure county-level trends. Since county-level language is easily available on Twitter using the Streaming API, we explore multiple domain adaptation algorithms to adapt user-level Facebook models to Twitter language. We find that domain-adapted and scaled social media-based measurements of stress outperform sociodemographic variables (age, gender, race, education, and income), against ground-truth survey-based stress measurements, both at the user- and the county-level in the U.S. Twitter language that scores higher in stress is also predictive of poorer health, less access to facilities and lower socioeconomic status in counties. We conclude with a discussion of the implications of using social media as a new tool for monitoring stress levels of both individuals and counties.
研究の動機と目的
- ソーシャルメディア投稿における心理的ストレスの言語的表現、特に状態的ストレスと特質的ストレスの違いを理解すること。
- 標準化された心理的調査(PSS)に基づいて、FacebookおよびTwitterのデータを用いてユーザー単位の言語モデルを構築し、検証すること。
- 個別レベルのストレスモデルを郡レベルの予測にスケーリングする課題に、ドメイン適応技術を用いて対処すること。
- ユーザーおよび地理的レベルにおいて、ソーシャルメディア言語の予測力が社会的・文化的要因および基準となるアンケートデータに対してどのように評価されるかを検証すること。
- ソーシャルメディア言語が、スケールとしてのストレスのリアルタイムかつ非干渉的な監視ツールとして、公衆衛生介入にどのように役立つかを検討すること。
提案手法
- ペルセイブド・ストレススケール(PSS)アンケートに回答した601名のユーザーから、ソーシャルメディアデータ(FacebookおよびTwitter)を収集した。
- 言語的特徴(例:LIWC辞書)を用いて、ユーザーの投稿からストレスレベルを予測する教師あり言語モデルを訓練した。
- トランスファー学習およびドメイン適応技術を用いて、Facebookで学習したストレスモデルをTwitterの言語に適応させ、プラットフォームごとの自己開示の差を考慮した。
- ストリーミングAPIを用いてTwitterデータを郡レベルに集約し、地理的地域へのスケーリングを実現した。
- 個別レベルから郡レベルへの一般化を避けるために、生態的誤謬を回避するための重み付けおよびスケーリング手法を採用した。
- ユーザーおよび郡レベルで、基準となるPSSスコアと比較してモデルの性能を検証し、年齢、性別、人種、教育、収入などの社会的・文化的要因と比較した。
実験結果
リサーチクエスチョン
- RQ1心理的ストレスは、ソーシャルメディア投稿においてどのように言語的に表現されており、特に非ストレス関連のトピックとどのように対照的か?
- RQ2Facebookの言語がTwitterの言語よりもストレス予測にどれほど優れているのか、その理由は何か?
- RQ3Facebookデータで学習したユーザー単位のストレスモデルを、Twitterデータを用いて郡レベルのストレス予測に効果的に適応できるか?
- RQ4言語ベースのストレスモデルは、個別および郡レベルのストレス予測において、社会的・文化的要因と比較してどの程度優れているか?
- RQ5ソーシャルメディアから導出された郡レベルのストレススコアと、健康状態や社会経済的地位といった現実世界の指標との間にどのような関連があるか?
主な発見
- ストレスを感じるユーザーは、疲労、コントロールの喪失、自己中心的思考、身体的痛みについて頻繁に投稿する一方、ストレスを感じないユーザーは朝食、家族との時間、旅行について語ることが多かった。
- Facebookの言語的特徴は、Twitterのそれよりもストレス予測に顕著に優れており、自己開示の度合いや投稿長の違いがその理由と考えられる。
- Facebookデータで学習したドメイン適応型言語モデルをTwitterデータに適用することで、郡レベルのストレスを効果的に予測でき、社会的・文化的要因を上回る性能を示した。
- Twitter言語から導出された郡レベルのストレススコアは、健康状態の悪化、施設へのアクセスの悪さ、低い社会経済的地位と相関していた。
- LIWCのような言語的辞書は、投稿頻度などの行動ベースの特徴よりもストレス予測において優れており、コンテンツの質が行動の特徴よりも重要であることが示された。
- 本研究では、ソーシャルメディア言語が、個別および地理的レベルにおいて、妥当でスケーラブルかつリアルタイムな心理的ストレスの代理指標として機能できることを示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。