QUICK REVIEW

[論文レビュー] Sharing Generative Models Instead of Private Data: A Simulation Study on Mammography Patch Classification

Zuzanna Szafranowska, Richard Osuala|arXiv (Cornell University)|Mar 8, 2022

AI in cancer detection参考文献 29被引用数 10

ひとこと要約

本研究では、乳がんパッチ分類におけるモデルの汎化性能を向上させるために、患者の実際のデータの代わりに訓練済みの生成対抗ネットワーク（GAN）を共有することを提案する。2つの外部施設から得たGANを第三者の施設に移管することで、CNNおよびトランスフォーマー分類器の性能が顕著に向上した。特にデータが少ない状況下で顕著であり、GANから生成された合成データが訓練を補完する上で有効であり、同時にプライバシーを保護する可能性を示した。

ABSTRACT

Early detection of breast cancer in mammography screening via deep-learning based computer-aided detection systems shows promising potential in improving the curability and mortality rates of breast cancer. However, many clinical centres are restricted in the amount and heterogeneity of available data to train such models to (i) achieve promising performance and to (ii) generalise well across acquisition protocols and domains. As sharing data between centres is restricted due to patient privacy concerns, we propose a potential solution: sharing trained generative models between centres as substitute for real patient data. In this work, we use three well known mammography datasets to simulate three different centres, where one centre receives the trained generator of Generative Adversarial Networks (GANs) from the two remaining centres in order to augment the size and heterogeneity of its training dataset. We evaluate the utility of this approach on mammography patch classification on the test set of the GAN-receiving centre using two different classification models, (a) a convolutional neural network and (b) a transformer neural network. Our experiments demonstrate that shared GANs notably increase the performance of both transformer and convolutional classification models and highlight this approach as a viable alternative to inter-centre data sharing.

研究の動機と目的

深層学習を用いた乳がん検出において、臨床施設が直面する限られたかつ非均質なトレーニングデータの課題に対処すること。
外部施設間で実際の患者データを共有する代わりに、訓練済みの生成モデル（GAN）を共有することでプライバシー保護型の代替手段となり得るかどうかを調査すること。
外部データセット上で訓練されたGANから生成された合成パッチを用いて、分類モデルの性能向上を評価すること。
CNNおよびトランスフォーマーの両アーキテクチャにおいて、単一ソースの合成データと複数ソースの合成データを用いたGANベースのデータ拡張の有効性を比較すること。
データ不足がモデル性能に与える影響を評価し、GANによって生成されたデータがこの制限をどの程度緩和できるかを検証すること。

提案手法

INbreast、BCDR、OPTIMAMの3つの代表的なマンモグラフィー・データセットを用い、3つの臨床施設を模擬した。1つの施設（A）が他の2つの施設（BおよびC）からGANを受け取った。
施設BおよびCで訓練されたGAN（DCGANおよびWGAN-GP）を用いて、合成された病変パッチを生成し、それらを施設Aのトレーニングデータに拡張した。
クラス不均衡を補うために、施設Aの自身のINbreastデータセットから、合成病変パッチの数と一致する数の健全パッチを抽出した。
2つの分類モデルをトレーニングおよび評価した：畳み込みニューラルネットワーク（CNN）とSwinトランスフォーマー。両方とも施設Aの実データと、実データ＋合成データの両方を用いた。
性能指標として、正解率、F1スコア、AUROC、AUPRCを用い、結果は3つの異なるランダムシードで平均化して、妥当性を確保した。
本研究では、2つのデータ環境（完全なトレーニングデータ（100％）と削減されたデータ（50％））を比較し、データ不足がモデルに与える影響を評価した。

実験結果

リサーチクエスチョン

RQ1実際の患者データの代わりに訓練済みのGANを共有することで、乳がんパッチ分類モデルの性能を顕著に向上させることができるか？
RQ2GANベースの合成データ拡張は、特にデータが少ない状況下でモデルの汎化性能にどのように影響を与えるか？
RQ3合成データによる性能向上は、CNNとトランスフォーマーで異なるか。もし異なる場合、その理由は何か？
RQ4BCDRおよびOPTIMAMの両方のソースからの合成データを組み合わせることと、単一ソースからのデータを用いることの効果を比較するとどうなるか？
RQ5実際のデータセット間のドメインシフト（例：BCDRとINbreast）が、GANによって生成されたデータの有用性にどの程度影響を与えるか？

主な発見

INbreastデータの50％のみでトレーニングしたSwinトランスフォーマーでは、F1スコアが0.734に達したが、BCDRからの合成パッチと一致する健全パッチを追加することで、0.880に上昇した（+0.146）。
GANによって生成されたデータによる性能向上は、特にデータが少ない状況（50％データ）と、パラメータ数が2800万（CNNの110万と比較して）多いSwinトランスフォーマーにおいて顕著であり、より高いデータ効率性を必要とするモデルであることを示唆している。
BCDRおよびOPTIMAMの両方からの合成データを組み合わせても、単一ソースからの100％合成データを用いる場合を上回ることはなかった。これは、ドメインシフトの増加が学習を妨げる可能性があることを示唆しており、多様性の向上にもかかわらず。
驚くべきことに、実際のBCDRパッチは合成BCDRパッチよりも性能が悪かった。これは、INbreastとBCDRの間で画像コントラスト、強度、病変形状にドメインシフトが生じているためと考えられる。
両モデルにおいて、合成データを用いることでAUROCおよびAUPRCの値が顕著に向上した。特にSwinトランスフォーマーでは、両ソースからの合成データを用いることで、AUROCが0.995、AUPRCが0.994に達した。
結果から、GANベースのデータ共有は、データ不足がモデル性能を制限する状況において、実用的でプライバシー保護型の施設間データ共有の代替手段であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。