Skip to main content
QUICK REVIEW

[論文レビュー] A CNN-based methodology for breast cancer diagnosis using thermal images

Juan Zuluaga-Gómez, Zeina Al Masry|arXiv (Cornell University)|Oct 30, 2019
Infrared Thermography in Medicine参考文献 48被引用数 28
ひとこと要約

本研究では、熱画像を用いた、畳み込みニューラルネットワーク(CNN)ベースの画像診断支援システムを提案し、データ拡張と最適化されたハイパーパrameterが性能向上に顕著に寄与することを示した。この手法は57例のデータセット上で92%の正確性と92%のF1スコアを達成し、ResNet50 や Inception といった最先端モデルを上回った。また、データ拡張により同等の性能を得るためのデータベースサイズを50%削減できた。

ABSTRACT

Micro Abstract: A recent study from GLOBOCAN disclosed that during 2018 two million women worldwide had been diagnosed from breast cancer. This study presents a computer-aided diagnosis system based on convolutional neural networks as an alternative diagnosis methodology for breast cancer diagnosis with thermal images. Experimental results showed that lower false-positives and false-negatives classification rates are obtained when data pre-processing and data augmentation techniques are implemented in these thermal images. Background: There are many types of breast cancer screening techniques such as, mammography, magnetic resonance imaging, ultrasound and blood sample tests, which require either, expensive devices or personal qualified. Currently, some countries still lack access to these main screening techniques due to economic, social or cultural issues. The objective of this study is to demonstrate that computer-aided diagnosis(CAD) systems based on convolutional neural networks (CNN) are faster, reliable and robust than other techniques. Methods: We performed a study of the influence of data pre-processing, data augmentation and database size versus a proposed set of CNN models. Furthermore, we developed a CNN hyper-parameters fine-tuning optimization algorithm using a tree parzen estimator. Results: Among the 57 patients database, our CNN models obtained a higher accuracy (92\%) and F1-score (92\%) that outperforms several state-of-the-art architectures such as ResNet50, SeResNet50 and Inception. Also, we demonstrated that a CNN model that implements data-augmentation techniques reach identical performance metrics in comparison with a CNN that uses a database up to 50\% bigger. Conclusion: This study highlights the benefits of data augmentation and CNNs in thermal breast images. Also, it measures the influence of the database size in the performance of CNNs.

研究の動機と目的

  • マムグラムやMRIの限界を克服するため、低コストで信頼性の高い熱画像を用いた乳がん診断システムの開発を目的とする。
  • データ前処理、データ拡張、データベースサイズが、熱画像分類におけるCNN性能に与える影響を評価することを目的とする。
  • モデルの汎化性能を向上させるために、木型パルゼン推定器を用いたCNNハイパーパrameter最適化を目的とする。
  • DMR-IR熱画像データベースを用いて、最先端のCNNアーキテクチャの性能をベンチマークすることを目的とする。
  • 医療画像分野における低データ環境において、データ拡張とデータベースサイズのトレードオフを確立することを目的とする。

提案手法

  • 57例の熱画像データベース(DMR-IR)を用いて、独自に設計したCNNアーキテクチャを訓練した。過学習やバイアスを最小限に抑えるために、慎重なデータ分割を実施した。
  • 画像品質の向上とモデル収束の促進を目的として、正規化や強調処理などの前処理技術を適用した。
  • 回転、反転、スケーリングなどのデータ拡張技術を用いて、訓練データセットを人工的に拡張し、モデルのロバスト性を向上させた。
  • 木型パルゼン推定器に基づくハイパーパrameter最適化アルゴリズムを用いて、CNNアーキテクチャおよび学習パラメータを微調整した。
  • さまざまなデータベースサイズおよび拡張条件の下で、複数のCNNモデル(ResNet50、Inception、VGG16など)の性能を比較した。
  • モデルの性能を評価するために、正確性、適合率、再現率、F1スコアの系統的評価を、さまざまな設定条件下で実施した。

実験結果

リサーチクエスチョン

  • RQ1データ拡張は、限られた熱画像データセットにおけるCNNベースの乳がん診断モデルの性能にどのように影響を与えるか?
  • RQ2低データ環境における熱画像分類において、データベースサイズとデータ拡張の最適なトレードオフは何か?
  • RQ3より単純で小さなCNNアーキテクチャは、ResNet50 や Inception といった複雑な最先端モデルを上回る性能を示せるか?
  • RQ4木型パルゼン推定器を用いたハイパーパラメータ最適化は、モデルの正確性と汎化性能にどのように影響を与えるか?
  • RQ5前処理およびデータ分割戦略は、熱画像におけるCNN学習における過学習とバイアスをどの程度低減できるか?

主な発見

  • 提案されたCNNモデルは、DMR-IRデータセット上で92%の正確性、94%の適合率、91%の再現率、92%のF1スコアを達成し、ResNet50、SeResNet50、Inceptionを上回った。
  • データ拡張により、全データベースサイズにおいて、拡張なしモデルと比較して平均F1スコアが少なくとも10%向上した。
  • 20例のデータセットを用いた拡張付きモデルは、30例の非拡張データセットを用いた非拡張モデルと同等の性能を達成した。
  • データ拡張により、性能指標の分散が著しく低下し、拡張なし(10例)では16%であったのに対し、拡張あり(47例)では4%にまで低下した。これは、モデルのロバスト性が向上したことを示している。
  • 40〜47例の範囲で性能指標が安定化し、この範囲を超えると利得が著しく減少し、分散の増加も最小限に抑えられた。
  • 本研究では、DMR-IR熱画像データベースにおける複数のCNNアーキテクチャのベンチマークを初めて確立し、同データセットにおける木型パルゼン推定器を用いたハイパーパラメータ最適化の初の試みを実施した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。