Skip to main content
QUICK REVIEW

[論文レビュー] Deriving information from missing data: implications for mood prediction

Yue Wu, Terry Lyons|arXiv (Cornell University)|Jun 26, 2020
Mental Health Research Topics参考文献 18被引用数 28
ひとこと要約

本稿では、双極性障害(BD)、境界性パーソナリティ障害(BPD)、健常対照者(HC)における診断および気分予測の向上を目的として、縦断的気分データ解析に欠損反応を組み込む署名ベースの機械学習手法を提案する。欠損反応を粗い経路フレームワーク内での情報的イベントとして扱うことで、診断精度は66%に達し、欠損データを無視する単純なモデルに比べて顕著に優れている。特にBPD分類および気分状態予測において顕著な改善が得られた。

ABSTRACT

The availability of mobile technologies has enabled the efficient collection prospective longitudinal, ecologically valid self-reported mood data from psychiatric patients. These data streams have potential for improving the efficiency and accuracy of psychiatric diagnosis as well predicting future mood states enabling earlier intervention. However, missing responses are common in such datasets and there is little consensus as to how this should be dealt with in practice. A signature-based method was used to capture different elements of self-reported mood alongside missing data to both classify diagnostic group and predict future mood in patients with bipolar disorder, borderline personality disorder and healthy controls. The missing-response-incorporated signature-based method achieves roughly 66\% correct diagnosis, with f1 scores for three different clinic groups 59\% (bipolar disorder), 75\% (healthy control) and 61\% (borderline personality disorder) respectively. This was significantly more efficient than the naive model which excluded missing data. Accuracies of predicting subsequent mood states and scores were also improved by inclusion of missing responses. The signature method provided an effective approach to the analysis of prospectively collected mood data where missing data was common and should be considered as an approach in other similar datasets.

研究の動機と目的

  • 精神障害患者の前向きに収集された自己報告気分データセットにおける非ランダムな欠損データの課題に対処すること。
  • 欠損反応を情報的特徴として組み込むことで、診断分類および将来の気分予測が向上するかを評価すること。
  • 反応と欠損データの間の時間的ダイナミクスおよび相互作用を捉える署名ベース手法の開発と検証すること。
  • 欠損データを組み込んだモデルの性能を、欠損データを無視する標準的手法と比較すること。
  • ASRMおよびQIDS自己報告データを用いて、BD、BPD、HCの区別に本手法の有効性を評価すること。

提案手法

  • 2次元に連結された気分データ(ASRMおよびQIDSスコア)に、粗い経路理論からの署名手法を適用し、欠損反応は-1として符号化する。
  • 欠損反応を数え上げ過程内のイベントとして扱い、時間的順序を保持することで、反応と欠測の両方を含むパターンを署名が捉えることが可能になる。
  • 時間的ダイナミクスを時間経過にわたって表現するため、レベル2の署名特徴抽出が用いられる。
  • 分類、状態予測、スコア予測の各タスクに、ランダムフォレスト分類器および回帰器をベースモデルとして用いる。
  • 本手法は、すべての欠損データポイントを分析から除外する単純なベースラインと比較される。
  • 本手法は、少なくとも20週間にわたる週次気分評価が得られた126名の参加者を対象とするAMoSS研究で検証された。

実験結果

リサーチクエスチョン

  • RQ1縦断的気分データにおける欠損反応は、無視されるのではなく、情報的特徴として活用可能か?
  • RQ2署名ベース特徴に欠損データを組み込むことで、BD、BPD、HCの診断分類精度が向上するか?
  • RQ3欠損データを含むモデルと含まないモデルの間で、気分状態およびスコア予測の性能はどのように異なるか?
  • RQ4署名手法は、BPD患者とBD患者の間で気分不安定パターンの違いを効果的に捉えることができるか?
  • RQ5非ランダムな欠損性が存在する状況において、署名ベースモデルは、標準的な補完法や除外ベースのアプローチよりもより頑健であるか?

主な発見

  • 欠損反応を組み込んだ署名ベースモデルは、全体で66%の診断精度を達成し、欠損データを無視する単純なモデルを顕著に上回った。
  • F1スコアはBDで59%、HCで75%、BPDで61%であり、BPD分類は単純モデルで0.5未満だったのを、本手法では0.6以上に改善した。
  • BPD患者がBD患者と誤分類される割合は、約40%から1/3未満に低下し、BPD特有の気分不安定性をよりよく捉えていることが示された。
  • 欠損反応を含めた場合、全群における気分状態予測精度が向上し、特にQIDSおよびASRMの状態予測で顕著な改善が得られた。
  • 将来のASRMおよびQIDSスコアの予測精度についても、署名特徴に欠損データを組み込むことで向上が確認された。
  • 非ランダムな欠損性に対しても本手法は頑健であることが示され、欠損データが潜在的な気分ダイナミクスに関する意味のある情報を含んでいる可能性が示唆された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。