[論文レビュー] Deep-learning models improve on community-level diagnosis for common congenital heart disease lesions
本研究では、胎児エコーカーディオグラムを用いて、tetralogy of Fallot (TOF) および hypoplastic left heart syndrome (HLHS) の自動産前診断のためのディープラーニングモデルを開発および評価した。モデルは、重要な心臓画像の特定において高い正確性(Fスコア:0.95)を達成し、TOF(感度75%、特異度76%)およびHLHS(感度100%、特異度90%)の検出において、コミュニティレベルの診断率を著しく上回った。
Prenatal diagnosis of tetralogy of Fallot (TOF) and hypoplastic left heart syndrome (HLHS), two serious congenital heart defects, improves outcomes and can in some cases facilitate in utero interventions. In practice, however, the fetal diagnosis rate for these lesions is only 30-50 percent in community settings. Improving fetal diagnosis of congenital heart disease is therefore critical. Deep learning is a cutting-edge machine learning technique for finding patterns in images but has not yet been applied to prenatal diagnosis of congenital heart disease. Using 685 retrospectively collected echocardiograms from fetuses 18-24 weeks of gestational age from 2000-2018, we trained convolutional and fully-convolutional deep learning models in a supervised manner to (i) identify the five canonical screening views of the fetal heart and (ii) segment cardiac structures to calculate fetal cardiac biometrics. We then trained models to distinguish by view between normal hearts, TOF, and HLHS. In a holdout test set of images, F-score for identification of the five most important fetal cardiac views was 0.95. Binary classification of unannotated cardiac views of normal heart vs. TOF reached an overall sensitivity of 75% and a specificity of 76%, while normal vs. HLHS reached a sensitivity of 100% and specificity of 90%, both well above average diagnostic rates for these lesions. Furthermore, segmentation-based measurements for cardiothoracic ratio (CTR), cardiac axis (CA), and ventricular fractional area change (FAC) were compatible with clinically measured metrics for normal, TOF, and HLHS hearts. Thus, using guideline-recommended imaging, deep learning models can significantly improve detection of fetal congenital heart disease compared to the common standard of care.
研究の動機と目的
- TOF や HLHS のような深刻な先天性心疾患の産前診断率を向上させること。現時点では、コミュニティ設定では30–50%の症例でのみ診断されている。
- 教師あり学習を用いて、エコーカーディオグラムから標準的な胎児心臓画像を自動的に同定できるディープラーニングモデルを開発すること。
- 分類およびセグメンテーションベースのバイオメトリック測定を用いて、正常心臓とTOFおよびHLHSを区別するモデルの性能を評価すること。
- ディープラーニングが、日常的なコミュニティレベルの設定における現在の臨床実践を上回る診断正確性を達成できるかどうかを評価すること。
提案手法
- 2000年から2018年までの間、18–24週齢の胎児エコーカーディオグラム685例を用いた後向き分析。
- 5つの標準的胎児心臓スクリーニング画像の検出を目的とした畳み込みニューラルネットワークおよび完全畳み込みニューラルネットワークの学習。
- 教師あり学習を用いて、アノテーションのない心臓画像を正常、TOF、またはHLHSに分類する。
- セマンティックセグメンテーションを実装し、心胸比(CTR)、心臓軸(CA)、心室収縮面積変化率(FAC)といった主要バイオメトリック指標を測定する。
- ホールドアウトテストセットを用いた検証により、画像の病変検出におけるFスコア、感度、特異度を評価する。
- モデルが算出したバイオメトリック指標と臨床的測定値を比較し、整合性を評価する。
実験結果
リサーチクエスチョン
- RQ1ディープラーニングモデルは、エコーカーディオグラム画像から5つの標準的胎児心臓画像を正確に同定できるか?
- RQ2ディープラーニングモデルは、正常心臓とTOFまたはHLHSを区別する診断性能をどの程度達成できるか?
- RQ3ディープラーニングによるセグメンテーションベースのバイオメトリック測定(CTR、CA、FAC)は、臨床的測定値とどの程度一致するか?
- RQ4ディープラーニングモデルは、現在のコミュニティレベルの診断率を上回るTOFおよびHLHSの感度と特異度を達成できるか?
- RQ5ディープラーニングは、日常臨床現場における先天性心疾患の早期発見をどの程度向上させられるか?
主な発見
- ディープラーニングモデルは、エコーカーディオグラムから5つの最重要な胎児心臓画像を同定する際、Fスコア0.95を達成した。
- 正常対TOFの2値分類では、感度75%、特異度76%を達成し、一般的なコミュニティレベルの診断性能を上回った。
- 正常対HLHSの分類では、感度100%、特異度90%を達成し、優れた検出能力を示した。
- CTR、CA、FACのセグメンテーションベースの測定値は、正常、TOF、HLHSの心臓において、臨床的測定値と整合性を示した。
- モデルのHLHS検出性能は特に優れており、感度100%を達成したため、早期介入の可能性が極めて高い。
- 全体として、ディープラーニング手法は、一般的な先天性心疾患の病変に対する標準的コミュニティレベルの診断を著しく上回った。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。