QUICK REVIEW

[논문 리뷰] Identifying Depression on Twitter

Moin Nadeem|arXiv (Cornell University)|2016. 07. 25.

Mental Health via Writing참고 문헌 21인용 수 99

한 줄 요약

본 논문은 Twitter에서 수집된 대중 참여 라벨을 이용해 Major Depressive Disorder (MDD) 위험을 예측하는 텍스트 분류 접근법을 제시하며, 2.5M-트윗 코퍼스에서 81%의 정확도와 0.86의 정밀도를 달성한다. 우울 감지 문제를 텍스트 분류 문제로 다루고, 과거 최대 1년 간의 트윗에 대해 Bag of Words와 통계적 분류기를 사용한다.

ABSTRACT

Social media has recently emerged as a premier method to disseminate information online. Through these online networks, tens of millions of individuals communicate their thoughts, personal experiences, and social ideals. We therefore explore the potential of social media to predict, even prior to onset, Major Depressive Disorder (MDD) in online personas. We employ a crowdsourced method to compile a list of Twitter users who profess to being diagnosed with depression. Using up to a year of prior social media postings, we utilize a Bag of Words approach to quantify each tweet. Lastly, we leverage several statistical classifiers to provide estimates to the risk of depression. Our work posits a new methodology for constructing our classifier by treating social as a text-classification problem, rather than a behavioral one on social media platforms. By using a corpus of 2.5M tweets, we achieved an 81% accuracy rate in classification, with a precision score of .86. We believe that this method may be helpful in developing tools that estimate the risk of an individual being depressed, can be employed by physicians, concerned individuals, and healthcare agencies to aid in diagnosis, even possibly enabling those suffering from depression to be more proactive about recovering from their mental health.

연구 동기 및 목표

소셜 미디어를 데이터 원천으로 활용하여 MDD를 발병 전에 예측하도록 동기를 부여한다.
우울 탐지를 사회 플랫폼에서의 행동 문제가 아닌 언어적 문제로 다루는 텍스트 분류 프레임워크를 제안한다.
스스로 우울을 보고한 Twitter 이용자로부터 라벨이 부착된 데이터셋을 구성한다.
분석에 앞서 최대 1년 간의 트윗에 걸친 대형 코퍼스에서 분류기를 평가한다.

제안 방법

우울증 진단을 받았다고 자처하는 Twitter 이용자들의 대중 참여 라벨링.
사용자별로 최대 1년의 사전 트윗 코퍼스 구성.
텍스트를 정량화하기 위해 Bag of Words 접근법으로 트윗을 표현한다.
통계적 분류기를 적용하여 우울 위험을 추정한다.
문제를 순수한 행동 분석이 아닌 텍스트 분류 문제로 다룬다.

실험 결과

연구 질문

RQ1Bag of Words 표현을 사용하여 Twitter 텍스트에서 우울 위험을 정확하게 감지할 수 있는가?
RQ2라벨이 부착된 대규모 Twitter 코퍼스에서 통계적 분류기의 예측 정확도와 정밀도는 어느 정도인가?
RQ3최대 1년의 사전 트윗을 활용하는 것이 짧은 시기에 비해 우울 위험 추정에 도움이 되는가?
RQ4이 방법론이 임상의, 간병인 또는 보건 기관이 우울 위험을 평가하는 도구를 제공할 수 있는가?

주요 결과

수집된 Twitter 코퍼스에서 우울 여부를 분류하는 데 81%의 정확도를 달성했다.
우울한 개인을 식별하는 데 0.86의 정밀도를 달성했다.
사용자당 2.5백만 트윗의 코퍼스와 1년의 사전 게시물을 사용했다.
소셜 미디어 데이터를 텍스트 분류 문제로 다루는 것이 우울 탐지에 효과적일 수 있음을 시연했다.
이 방법은 Bag of Words 특징과 통계적 분류기에 의존하여 우울 위험을 추정한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.