[论文解读] Monitoring Depression Trend on Twitter during the COVID-19 Pandemic
本研究提出了迄今为止最大规模的公开英文Twitter抑郁症数据集(2,575名被识别出的用户),并训练了基于Transformer的模型(BERT、RoBERTa、XLNet)以监测COVID-19疫情期间的抑郁症趋势。研究结果表明,将深度学习与心理特征及人口统计学数据结合可显著提升分类准确率,并在群体层面和总体人群层面的分析中揭示出抑郁症信号的上升趋势,尤其在关键疫情事件期间表现明显。
The COVID-19 pandemic has severely affected people's daily lives and caused tremendous economic loss worldwide. However, its influence on people's mental health conditions has not received as much attention. To study this subject, we choose social media as our main data resource and create by far the largest English Twitter depression dataset containing 2,575 distinct identified depression users with their past tweets. To examine the effect of depression on people's Twitter language, we train three transformer-based depression classification models on the dataset, evaluate their performance with progressively increased training sizes, and compare the model's "tweet chunk"-level and user-level performances. Furthermore, inspired by psychological studies, we create a fusion classifier that combines deep learning model scores with psychological text features and users' demographic information and investigate these features' relations to depression signals. Finally, we demonstrate our model's capability of monitoring both group-level and population-level depression trends by presenting two of its applications during the COVID-19 pandemic. We hope this study can raise awareness among researchers and the general public of COVID-19's impact on people's mental health.
研究动机与目标
- 为解决在类似COVID-19全球危机期间,社交媒体上抑郁症研究缺乏大规模、公开可用数据集的问题。
- 基于一个经过精心筛选的5,150名用户的大型数据集,开发并评估基于Transformer的模型,以检测Twitter用户中的抑郁症。
- 探究心理、语言和人口统计学特征在提升深度学习模型抑郁症分类性能方面的作用,超越仅依赖深度学习模型的性能。
- 将模型应用于实时监测疫情期间的群体层面(如抑郁症与非抑郁症用户)和总体人群层面(如美国各州)的抑郁症趋势。
- 通过数据驱动、可扩展的社交媒体公共情绪监测,提高对疫情心理健康影响的认识。
提出的方法
- 构建了一个大规模的Twitter抑郁症数据集,包含5,150名用户(2,575名抑郁症用户,2,575名对照组),包含32,420段每段250个词的推文片段。
- 在逐步增大的训练子集上训练并评估三种最先进的Transformer模型——BERT、RoBERTa和XLNet,以评估性能随数据量增长的扩展性。
- 实施了一种分块与重组方法,以支持推文级别和用户级别的分类,提升模型的鲁棒性和评估的可靠性。
- 开发了一种融合分类器,将深度学习模型输出与心理特征(LIWC、情感)、人格特质及人口统计学数据相结合,以增强预测准确性。
- 应用潜在狄利克雷分布(LDA)分析关键疫情事件前后(如美国国家紧急状态宣布)推文中的主导主题。
- 汇总美国境内地理定位用户的抑郁症评分,以追踪各州及全国层面的趋势,并对比纽约州、加利福尼亚州和佛罗里达州的情况。
实验结果
研究问题
- RQ1在大规模、精心筛选的Twitter数据集上,基于Transformer的抑郁症检测模型性能如何随训练数据规模的增加而变化?
- RQ2心理和人口统计学特征在多大程度上提升了深度学习模型在社交媒体抑郁症分类中的准确性?
- RQ3在疫情期间,不同用户群体(抑郁症用户(DP)与非抑郁症用户(ND))的抑郁症水平如何随时间演变,尤其是在重大公共卫生公告之后?
- RQ4在美国国家紧急状态宣布前后,用户推文中主导的主题是什么?这些主题与抑郁症信号变化之间有何关联?
- RQ5该模型能否检测并追踪美国各州的总体人群抑郁症趋势?各地区在情绪倾向和主题关注上的差异是否与这些趋势相关?
主要发现
- 所有三种Transformer模型(BERT、RoBERTa、XLNet)的性能均随着训练数据规模的增加而显著提升,验证了大规模数据集的价值。
- 融合分类器(结合深度学习与LIWC、情感及人口统计学特征)的准确率高于仅使用深度学习模型,证明了心理和上下文特征的附加价值。
- 在美国国家紧急状态宣布后,非抑郁症用户(ND)的抑郁症水平显著上升,而抑郁症用户(DP)的抑郁症水平略有下降,表明对环境压力源的敏感性存在差异。
- 在美国国家紧急状态宣布后,DP和ND用户中出现频率最高的主题均变为“COVID-19期间的抑郁与焦虑”,表明疫情相关话题与抑郁症信号上升存在强烈关联。
- 所有三个州——纽约州、加利福尼亚州和佛罗里达州——均显示出相似的抑郁症趋势模式:紧急状态前出现短暂下降,宣布后上升,随后短暂回落,5月10日之后急剧上升;其中佛罗里达州整体抑郁症评分始终较低。
- 各州层面的主题建模显示,纽约用户最常讨论医院相关新闻,而佛罗里达州和加利福尼亚州用户相较于全国平均水平,对政府政策及疫情带来的生活变化表现出更高的关注度。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。