[論文レビュー] A Multi-Modal AI System for Screening Mammography: Integrating 2D and 3D Imaging to Improve Breast Cancer Detection in a Prospective Clinical Study
FFDM、合成マンモグラフィー(C-View)およびDBTを統合するAIシステムは乳房レベルの癌予測と病変の境界ボックス局在を提供;内部AUROCは0.945、リコールと放射線科医の作業負荷を低減、強力な外部一般化と前向き導入結果を示す。
Although digital breast tomosynthesis (DBT) improves diagnostic performance over full-field digital mammography (FFDM), false-positive recalls remain a concern in breast cancer screening. We developed a multi-modal artificial intelligence system integrating FFDM, synthetic mammography, and DBT to provide breast-level predictions and bounding-box localizations of suspicious findings. Our AI system, trained on approximately 500,000 mammography exams, achieved 0.945 AUROC on an internal test set. It demonstrated capacity to reduce recalls by 31.7% and radiologist workload by 43.8% while maintaining 100% sensitivity, underscoring its potential to improve clinical workflows. External validation confirmed strong generalizability, reducing the gap to a perfect AUROC by 35.31%-69.14% relative to strong baselines. In prospective deployment across 18 sites, the system reduced recall rates for low-risk cases. An improved version, trained on over 750,000 exams with additional labels, further reduced the gap by 18.86%-56.62% across large external datasets. Overall, these results underscore the importance of utilizing all available imaging modalities, demonstrate the potential for clinical impact, and indicate feasibility of further reduction of the test error with increased training set when using large-capacity neural networks.
研究の動機と目的
- AIを用いた米国スクリーニングにおける偽陽性リコールと放射線科医作業負荷の低減を動機づける。
- FFDM、C-View、DBTをバウンディングボックス局在とともに活用する多モーダルAIシステムを開発する。
- 病理診断で-confirmed cancerラベルと境界ボックス注釈を用いて学習させ、解釈性を向上させる。
- 外部データセットおよび複数拺地での前向き臨床導入における一般化を評価する。
提案手法
- 境界ボックス予測と画像レベルの癌確率を生成する修正YOLOXアーキテクチャを使用する。
- すべてのDBTスライスを処理して深度情報を保持し、胸部レベル出力のためにモダリティ別予測をアンサンブルする。
- 学習を病理診断で確認された癌ラベルと境界ボックス注釈という二重信号でガイドする。
- FFDM、C-View、DBTを胸部レベルの平均と多モーダル境界ボックス融合でアンサンブル予測する。
- 内部テストセットで評価(AUROC 0.945; 95% CI 0.930–0.960)および7つの外部データセット、 retrospective recall-reductionと前向き臨床影響を評価。
実験結果
リサーチクエスチョン
- RQ13モダリティのマンモグラフィーAIシステム(FFDM、C-View、DBT)が単一モダリティを超える乳がん検出を実現できるか。
- RQ2多モーダルアンサンブルが胸部レベルAUROCと境界ボックス局在性能に与える影響は外部データセット間でどうか。
- RQ3前向きAI支援解釈は米国スクリーニングワークフローでリコール率と放射線科医作業負荷を低減するか。
- RQ4トレーニングデータ量の増加が大規模外部データセットでの性能と一般化性にどう影響するか。
主な発見
- 38,368枚の乳房での内部AUROCは0.945(CI 0.930–0.960)でV1、V2テストセットで0.953(CI 0.938–0.967)。
- 悪性病変の境界ボックスAUFROC1は内部テストセットで0.848(V1)および0.945(V2)。
- 外部データセットは強い一般化性を示し、V2モデルはV1を上回りGMICや3D-GMICなどのベースラインを複数データセットで超える。
- 18拠点での前向き導入により低リスク(緑色)検査のリコール率を低減し、実務ワークフローでのAI支援適応を実証。
- 768,493件の検査で追加ラベルを用いて訓練された改良モデルは、巨大な外部データセットでの性能ギャップを18.86%–56.62%低減。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。