Skip to main content
QUICK REVIEW

[論文レビュー] Identifying Depression on Twitter

Moin Nadeem|arXiv (Cornell University)|Jul 25, 2016
Mental Health via Writing参考文献 21被引用数 99
ひとこと要約

本論文は、Twitterからのクラウドソーシングされたラベルを用いてMajor Depressive Disorder (MDD)リスクを予測するテキスト分類アプローチを構築し、2.5Mツイートコーパスで81%の精度と0.86の適合率を達成している。うつ病検出をテキスト分類問題として扱い、過去1年分のツイートまでのBag of Wordsと統計分類器を用いる。

ABSTRACT

Social media has recently emerged as a premier method to disseminate information online. Through these online networks, tens of millions of individuals communicate their thoughts, personal experiences, and social ideals. We therefore explore the potential of social media to predict, even prior to onset, Major Depressive Disorder (MDD) in online personas. We employ a crowdsourced method to compile a list of Twitter users who profess to being diagnosed with depression. Using up to a year of prior social media postings, we utilize a Bag of Words approach to quantify each tweet. Lastly, we leverage several statistical classifiers to provide estimates to the risk of depression. Our work posits a new methodology for constructing our classifier by treating social as a text-classification problem, rather than a behavioral one on social media platforms. By using a corpus of 2.5M tweets, we achieved an 81% accuracy rate in classification, with a precision score of .86. We believe that this method may be helpful in developing tools that estimate the risk of an individual being depressed, can be employed by physicians, concerned individuals, and healthcare agencies to aid in diagnosis, even possibly enabling those suffering from depression to be more proactive about recovering from their mental health.

研究の動機と目的

  • 発症前にMajor Depressive Disorder (MDD)を予測するために、ソーシャルメディアをデータ源として活用する動機づけ。
  • うつ病検出を社会プラットフォーム上の行動的な問題ではなく、言語的な問題として扱うテキスト分類フレームワークを提案する。
  • 自己申告でうつ病を公表したTwitterユーザーからラベル付きデータセットを構築する。
  • 分析前の最大1年前にわたる大規模ツイートコーパスで分類器を評価する。

提案手法

  • うつ病と診断されたと公言するTwitterユーザーのクラウドソーシングによるラベリング。
  • 各ユーザーにつき最大1年分の以前のツイートのコーパスを組み立てる。
  • テキストを定量化するためにBag of Wordsアプローチでツイートを表現する。
  • 統計分類器を適用してうつ病リスクを推定する。
  • ソーシャルメディア上の行動分析だけでなく、問題をテキスト分類として扱う。

実験結果

リサーチクエスチョン

  • RQ1Bag of Words表現を用いたTwitterテキストからうつ病リスクを高精度に検出できるか。
  • RQ2大規模なラベル付きTwitterコーパスに対する統計分類器の予測精度と適合率はどの程度か。
  • RQ3最大1年分の前ツイートを活用することで、短い履歴と比較してうつ病リスク推定精度は向上するか。
  • RQ4この方法論は臨床医、介護者、保健機関がうつ病リスクを評価するツールを支援できるか。

主な発見

  • 収集したTwitterコーパスでうつ病の分類に81%の精度を達成。
  • うつ状態の個人を特定する際の適合率0.86を達成。
  • 各ユーザーにつき前投稿1年分を含む2.5百万ツイートのコーパスを使用。
  • ソーシャルメディアデータをテキスト分類問題として扱うことがうつ病検出に有効であることを示した。
  • 本手法はBag of Words特徴と統計分類器に依存してうつ病リスクを推定する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。