QUICK REVIEW

[論文レビュー] A Review of Challenges and Opportunities in Machine Learning for Health

Marzyeh Ghassemi, Tristan Naumann|PubMed|Jun 1, 2018

Machine Learning in Healthcare参考文献 123被引用数 253

ひとこと要約

この論文は医療データ（特にEHR）に機械学習を適用する際の固有の課題を概観し、因果性、欠測データ、アウトカムの定義、非定常性を強調し、臨床医とMLの協力を呼びかける機会を示す。

ABSTRACT

Modern electronic health records (EHRs) provide data to answer clinically meaningful questions. The growing data in EHRs makes healthcare ripe for the use of machine learning. However, learning in a clinical setting presents unique challenges that complicate the use of common machine learning methodologies. For example, diseases in EHRs are poorly labeled, conditions can encompass multiple underlying endotypes, and healthy individuals are underrepresented. This article serves as a primer to illuminate these challenges and highlights opportunities for members of the machine learning community to contribute to healthcare.

研究の動機と目的

医療分野における機械学習の固有の技術的課題（因果性、欠測、アウトカム）と、それらがモデリングの選択に与える影響を強調する。
MLがタスクを自動化し、臨床医を支援し、臨床能力を拡張できる医療機会の階層を提示する。
臨床に有用で運用上実現可能なモデルを開発するため、ML研究者と臨床医の協力を促す。
データシフトの扱い、解釈性、および医療領域における表現学習の研究方向性を議論する。

提案手法

介入ベースの問いに答えるための核心要件としての因果性を論じる。
欠測データの機構（MCAR、MAR、MNAR）と、それらがモデル設計と評価にもたらす影響を説明する。
信頼性のあるアウトカム構築とEHRベースの学習におけるラベルリークのリスクを概説する。
医療機会の階層を提案し、タスク自動化、意思決定支援、能力拡張へML手法をマッピングする。
堅牢で解釈可能かつ協調的なMLシステムと、多元的ソースの医療データに対する表現学習を提唱する。

実験結果

リサーチクエスチョン

RQ1医療データへMLを適用する際に特有の核心的課題は何か、そしてそれらがモデルの妥当性と有用性にどう影響するか？
RQ2異種のEHRデータを用いてMLタスクを設計する際、アウトカムをどのように定義しラベリングすべきか？
RQ3医療データセットに内在する欠測データとバイアスをMLモデルはどのように考慮できるか？
RQ4解釈性と臨床医との協働を含む臨床現場でのML展開の機会と要件は何か？
RQ5医療MLにおけるデータの非定常性と表現に対処する研究方向は何か？

主な発見

因果性は介入ベースの質問に答えるためには不可欠であり、観察データを用いる際に課題を生じさせる。
欠測データの機構（MCAR、MAR、MNAR）はモデル化し、認識しておく必要があり、偏った予測や誤解を避ける。
医療におけるアウトカムは慎重な定義、文脈認識、ラベルリークの回避を要し、有意義な予測を保証する。
広範な3層構造の機会が存在する。タスクの自動化、臨床意思決定の支援、臨床能力の拡張、それぞれが異なる評価ニーズを持つ。
モデルの解釈可能性と正当化、そして多源データ向けの堅牢な表現が重要である。
高影響の問題を特定し、MLソリューションの運用可能性を確保するためには臨床協働が不可欠である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。