[論文レビュー] Multitask Classification and Segmentation for Cancer Diagnosis in Mammography
本稿では、ResNetバックボーンを搭載した完全畳み込みネットワークを用いて、マンモグラフィーにおけるがん分類と病変セグメンテーションを同時に実行するマルチタスク深層学習フレームワークを提案する。マルチタスク学習により分類とセグメンテーションの損失を同時に最適化することで、逐次学習に比べて平均Diceスコアが3.5%向上(38.28%)、AUCが2.5%向上(84.02%)し、共有表現学習による性能向上を実証した。
Annotation cost is a bottleneck for collecting massive data in mammography, especially for training deep neural networks. In this paper, we study the use of heterogeneous levels of annotation granularity to improve predictive performances. More precisely, we introduce a multi-task learning scheme for training convolutional neural network (ConvNets), which combines segmentation and classification, using image-level and pixel-level annotations. In this way, different objectives can be used to regularize training by sharing intermediate deep representations. Successful experiments are carried out on the Digital Database of Screening Mammography (DDSM) to validate the relevance of the proposed approach.
研究の動機と目的
- 画像レベルの分類とピクセルレベルのセグメンテーションを含む異種のアノテーションを活用することで、マンモグラフィーにおけるがん診断を改善すること。
- 分類とセグメンテーションのタスク間で表現を共有することで、医療画像データの限定的アノテーション問題に対処すること。
- 両タスクを同時に学習することで相関を活用し、一般化性能を向上させること。
- 大規模かつ完全にアノテートされたデータセットに依存することを減らすために、分類の恩恵を得るためにセグメンテーションで事前学習すること。
提案手法
- モデルは、入力となるマンモグラムから共有された局所的特徴を抽出するために、ResNet-50バックボーンを搭載した完全畳み込みネットワーク(FCN)を用いる。
- セグメンテーションヘッド(S-Net)は、1×1畳み込みとアップサンプリングを適用し、5つの病変クラスのピクセル単位のラベルを予測する。
- 分類ヘッド(C-Net)は、特徴マップに対してグローバル平均プーリングを適用し、その後全結合層を介してがんの有無(2値分類)を予測する。
- 総損失は、分類用のバイナリクロスエントロピー(ℒcls)とセグメンテーション用の重み付きクロスエントロピー(ℒseg)の重み付き組み合わせであり、λがトレードオフを制御する。
- セグメンテーションにおけるクラス不均衡は、クラス重み付きクロスエントロピー損失を用いることで軽減される。
- モデルは、DDS-Mデータセット上で両タスクの共同最適化を用いてエンドツーエンドで学習される。
実験結果
リサーチクエスチョン
- RQ1分類とセグメンテーションを同時に学習することで、それぞれのタスクを別々に学習する場合に比べ、マンモグラムがん診断の性能が向上するか?
- RQ2低データ環境下で、セグメンテーションで事前学習することで、下流の分類性能が向上するか?
- RQ3画像レベルとピクセルレベルの異種アノテーションを用いたマルチタスク学習が、マンモグラフィーにおける特徴表現の質にどのように影響するか?
- RQ4マルチタスク学習による共有表現が、医療画像解析における過学習を軽減し、一般化性能を向上させるか?
主な発見
- 共同マルチタスクモデルは、病変セグメンテーションで平均Diceスコア38.28%を達成し、逐次学習ベースライン(34.98%)に対して3.5ポイント向上した。
- 共同モデルはがん分類でAUC84.02%を達成し、逐次アプローチ(81.37%)に対して2.5ポイント向上した。
- 分類の微調整の前にセグメンテーションでモデルを事前学習することで、AUCが80.54%から81.37%に向上し、正のトランスファーフェクトが確認された。
- 定性的な結果から、共同手法は逐次ベースラインに比べてより正確な病変局在と高い分類の信頼性を示している。
- 可視化結果から、モデルは正常例およびがん例の両方で微細で複雑な病変を高い空間的正確性で捉えていることが示された。
- 結果から、マルチタスク学習が分類とセグメンテーションの間でより良い協調を可能にし、両タスクの性能向上に寄与することが確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。