QUICK REVIEW

[論文レビュー] Generative Adversarial Networks for Electronic Health Records: A Framework for Exploring and Evaluating Methods for Predicting Drug-Induced Laboratory Test Trajectories

Alexandre Yahi, R. Vanguri|arXiv (Cornell University)|Dec 1, 2017

Machine Learning in Healthcare参考文献 16被引用数 35

ひとこと要約

本論文は、生成対抗ネットワーク（GANs）を用いた画期的な教師なしフレームワークを提案し、特にコレステロールへのスタチンの影響を予測するための合成電子歴史記録（EHR）時系列データを生成する。深層自己符号化器とt-SNEクラスタリングを用いた臨床的コhortの分類を統合することで、生物学的に意味のあるクラスタに学習したGANsは、全コhortに学習させたモデルよりも、投与前および投与中のコレステロールトレンドを予測する性能が優れており、サブ-GANsは全GANsと比較して予測誤差を最大30%まで低減した。

ABSTRACT

Generative Adversarial Networks (GANs) represent a promising class of generative networks that combine neural networks with game theory. From generating realistic images and videos to assisting musical creation, GANs are transforming many fields of arts and sciences. However, their application to healthcare has not been fully realized, more specifically in generating electronic health records (EHR) data. In this paper, we propose a framework for exploring the value of GANs in the context of continuous laboratory time series data. We devise an unsupervised evaluation method that measures the predictive power of synthetic laboratory test time series. Further, we show that when it comes to predicting the impact of drug exposure on laboratory test data, incorporating representation learning of the training cohorts prior to training GAN models is beneficial.

研究の動機と目的

GANが生成するEHR時系列データの教師なし評価フレームワークを構築し、薬剤誘発性検査トレースを予測すること。
臨床的に情報のあるコhortの分類が、連続的な検査測定値に対する薬剤効果をモデル化する際のGANの予測精度を向上させるかどうかを調査すること。
深層自己符号化器による表現学習が、下流の予測タスクにおける合成時系列データの質に与える影響を評価すること。
生物学的に意味のある患者クラスタに学習させたGANsが、全コhortに学習させたものよりも、より予測可能な合成時系列を生成することを実証すること。

提案手法

4,830名のスタチン投与患者から得た全コレステロール時系列データを正規化・補間し、固定長16点ベクトル（投与前8点、投与中8点）に変換してモデル入力とした。
1,524個の臨床的特徴量を32次元の潜在空間に圧縮するための深層自己符号化器を適用し、その後t-SNEを用いて2次元可視化を行い、スプライスクラスタリングを用いて生物学的に意味のある患者グループを同定した。
全コhort（totalGAN）および同定された4つのクラスタそれぞれ（subGANs）に学習させた別個のGANsを訓練し、患者表現を条件とした合成時系列を生成した。
投与期間中の実際の時系列と合成時系列の類似性アライメントと平均二乗誤差（MSE）に基づく教師なし評価指標を提案し、真のラベルが不要な状況でも予測力の測定を可能にした。
臨床的クラスタと同等サイズのランダムクラスタリングをベースラインとして用い、臨床的分類がGAN性能向上に与える寄与の有意性を評価した。
予測誤差（P_err）を用いてモデル性能を評価し、クラスタおよびランダムグループごとに合成時系列と実際の時系列を比較した。

実験結果

リサーチクエスチョン

RQ1臨床的分類に基づく患者クラスタに学習させたGANsは、全コhortに学習させたモデルと比較して、実際の薬剤誘発性検査トレースをよりよく予測する合成EHR時系列を生成できるか？
RQ2深層自己符号化器による表現学習は、GANフレームワークにおける合成時系列の質と予測有用性にどのように影響するか？
RQ3患者特徴の教師なしクラスタリングが、ランダムクラスタリングと比較して、合成時系列の予測精度をどの程度向上させるか？
RQ4患者レベルの臨床的特徴をGAN学習プロセスに統合することで、生成時系列の現実性と予測的正確性が向上するか？
RQ5教師なし評価フレームワークは、ラベル付き結果が不要な状況でも、合成時系列の予測力を信頼性高く測定できるか？

主な発見

臨床的に意味のあるクラスタに学習させたサブ-GANsは、全GANsと比較して予測誤差（P_err）を最大30%まで低減した。特にクラスタ0では有意な20%の改善が見られ（p = 5.7e-4）、顕著な向上が確認された。
タイプ2糖尿病患者から構成されるクラスタ3に学習させたサブ-GANsは、P_errが0.12 ± 0.20にまで低下し、全GANsの0.15 ± 0.24よりも顕著に低い水準にまで改善された（p = 3.9e-4）。これは生物学的に整合性のあるサブグループにおいて優れた予測性能を示している。
臨床的クラスタに学習させたサブ-GANsは、クラスタ1を除く全クラスタで全GANsを上回る性能を示したが、クラスタ1では有意差は認められなかった（p = 1.5e-1）。
臨床的クラスタと同等サイズのランダムクラスタリングは、臨床的クラスタリングよりも顕著に悪い性能を示した。p値は1.1e-21から2.0e-303の範囲に分布し、クラスタリングの臨床的妥当性の重要性が裏付けられた。
深層自己符号化器は1,524個の臨床的特徴量を32次元の潜在空間に効果的に圧縮でき、クラスタリングの効果的実行とGAN学習の改善を可能にした。t-SNEでは、純粋な糖尿病クラスタ（クラスタ3）を明確に特定できた。
平均コレステロール値は投与前（170.6 mg/dL）から投与中（160.7 mg/dL）に低下し、期待されるスタチン効果が確認され、データの生物学的妥当性が裏付けられた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。