[論文レビュー] MAMMO: A Deep Learning Solution for Facilitating Radiologist-Machine Collaboration in Breast Cancer Diagnosis
MAMMOは、2段階のアプローチを用いる深層学習臨床意思決定支援システムであり、画像診断の正確性を向上させながらレントゲン診断医の作業負荷を42.8%削減する。まず、がん診断と放射線学的評価(例:乳房密度、懸念度)を同時に学習するマルチビュー・マルチタスク畳み込みニューラルネットワーク(CNN)を用い、次に、モデルの信頼度に基づき、どのマンモグラムがモデルによって自信を持って診断可能か、どの画像が放射線学的医師のレビューを必要とするかを特定するトリアージネットワークを構築する。このシステムは解釈可能性を高め、熟練医の注目を向けさせる複雑な症例を的確に特定する。
With an aging and growing population, the number of women requiring either screening or symptomatic mammograms is increasing. To reduce the number of mammograms that need to be read by a radiologist while keeping the diagnostic accuracy the same or better than current clinical practice, we develop Man and Machine Mammography Oracle (MAMMO) - a clinical decision support system capable of triaging mammograms into those that can be confidently classified by a machine and those that cannot be, thus requiring the reading of a radiologist. The first component of MAMMO is a novel multi-view convolutional neural network (CNN) with multi-task learning (MTL). MTL enables the CNN to learn the radiological assessments known to be associated with cancer, such as breast density, conspicuity, suspicion, etc., in addition to learning the primary task of cancer diagnosis. We show that MTL has two advantages: 1) learning refined feature representations associated with cancer improves the classification performance of the diagnosis task and 2) issuing radiological assessments provides an additional layer of model interpretability that a radiologist can use to debug and scrutinize the diagnoses provided by the CNN. The second component of MAMMO is a triage network, which takes as input the radiological assessment and diagnostic predictions of the first network's MTL outputs and determines which mammograms can be correctly and confidently diagnosed by the CNN and which mammograms cannot, thus needing to be read by a radiologist. Results obtained on a private dataset of 8,162 patients show that MAMMO reduced the number of radiologist readings by 42.8% while improving the overall diagnostic accuracy in comparison to readings done by radiologists alone. We analyze the triage of patients decided by MAMMO to gain a better understanding of what unique mammogram characteristics require radiologists' expertise.
研究の動機と目的
- がんスクリーニングにおける乳房レントゲン撮影のうち、放射線学的医師による読影を必要とする枚数を減らすと同時に、診断正確性を維持または向上させること。
- 放射線学的医師とAIの協働を可能にする臨床的統合性を持つシステムを構築すること、すなわち、AIが放射線学的医師を置き換えるのではなく補完すること。
- がん診断と併せて放射線学的評価(例:乳房密度、目立つ度合い)を学習することで、モデルの解釈可能性を向上させること。
- 放射線学的医師のレビューを要する症例に関連する患者特徴(例:年齢、乳房密度、病変タイプ)を同定し、臨床的優先順位付けを的確に行えるようにすること。
- モデルの信頼度に応じて、マンモグラムをAIまたは放射線学的医師に動的に割り当てるトリアージメカニズムを構築すること。
提案手法
- マルチビュー・マルチタスク学習(MTL)CNNが、両乳房のCCおよびMLO視野の4枚のマンモグラムを処理し、がん診断と乳房密度、懸念度などの放射線学的評価を同時に学習する。
- MTLアーキテクチャにより、がん診断のための特徴表現が向上し、放射線学的医師が検証可能な解釈可能な出力が得られる。
- 別個のトリアージネットワークがMTLの出力を用い、各マンモグラムを「AI診断可能」と「放射線学的医師の読影を要する」に分類する。この分類はモデルの信頼度に基づく。
- データ拡張戦略には、視野ごとのランダム変換(反転、回転)、マルチチャネルCLAHE、ガウスノイズ、および小バッチサイズのための手動サンプリングによるクラスバランス調整が含まれる。
- システムは、8,162名の患者からなるプライベートデータセットで訓練および評価されたが、外部データセット(CBIS-DDSM)は事前学習に使用されたが、性能向上は顕著ではなかった。
- モデルの性能は、さまざまなトリアージ運用ポイントにおける誤検出率および誤検出率を用いて評価され、最適な設定は事前に定義されたしきい値方程式により選択された。
実験結果
リサーチクエスチョン
- RQ1深層学習システムは、診断正確性を損なわせることなく、放射線学的医師による読影を要するマンモグラムの枚数を削減できるか?
- RQ2放射線学的評価(例:乳房密度、目立つ度合い)を含むマルチタスク学習は、診断性能とモデルの解釈性の両方をどのように向上させるか?
- RQ3モデルが自信を持って診断できない症例を予測するのに最も有用な患者特徴(例:年齢、乳房密度、病変タイプ)は何か?
- RQ4トリアージメカニズムは、低リスクと高リスクの症例を効果的に分離し、放射線学的医師の作業負荷を最適化できるか?
- RQ5モデルの解釈性機能(例:懸念度スコア)の統合は、放射線学的医師の信頼性と臨床的有用性を向上させるか?
主な発見
- MAMMOは、1,000名の患者からなるテストセットにおいて、放射線学的医師による読影枚数を42.8%削減したが、同時に放射線学的医師のみによる読影と比較して全体の診断正確性が向上した。
- トリアージネットワークは、放射線学的医師のレビューを要する患者の多くが、高乳房密度(50–74%および75–100%)、高齢(60歳以上)、および棘状病変(spiculated masses)を有することを特定した。
- 棘状病変を有する患者は、全放射線学的特徴の中でがん発症率が最も高く(44%)、モデルの複雑な症例への優先順位付けと整合的であった。
- マルチタスク学習の導入により、ネットワークががん関連の洗練された特徴表現を学習可能となり、診断性能が向上した。
- トリアージシステムは、誤検出と誤検出の両方を最小限に抑えるバランスを達成した。性能は図7に示された運用ポイントの across で可視化され、特定の信頼度しきい値で最適な性能が得られた。
- 外部データセット(例:CBIS-DDSM)は性能向上に顕著な寄与を示さなかった。これは、画像モalityの違い(フィルム対デジタルマンモグラフィ)に起因すると考えられる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。