QUICK REVIEW

[論文レビュー] On Breast Cancer Detection: An Application of Machine Learning Algorithms on the Wisconsin Diagnostic Dataset

Abien Fred Agarap|arXiv (Cornell University)|Nov 20, 2017

AI in cancer detection参考文献 16被引用数 33

ひとこと要約

本研究では、新しいGRU-SVMモデルを含む6つの機械学習アルゴリズムを、良性および悪性腫瘍の二値分類を目的としたウィsコンシン診断乳癌（WDBC）データセット上で評価した。マルチレイヤーパーセプトロン（MLP）が約99.04%の最高テスト正解率を達成し、全モデルの中で優れた性能を示した。全アルゴリズムが90%以上の正解率を達成しており、良好な一般化性能を示した。

ABSTRACT

This paper presents a comparison of six machine learning (ML) algorithms: GRU-SVM (Agarap, 2017), Linear Regression, Multilayer Perceptron (MLP), Nearest Neighbor (NN) search, Softmax Regression, and Support Vector Machine (SVM) on the Wisconsin Diagnostic Breast Cancer (WDBC) dataset (Wolberg, Street, & Mangasarian, 1992) by measuring their classification test accuracy and their sensitivity and specificity values. The said dataset consists of features which were computed from digitized images of FNA tests on a breast mass (Wolberg, Street, & Mangasarian, 1992). For the implementation of the ML algorithms, the dataset was partitioned in the following fashion: 70% for training phase, and 30% for the testing phase. The hyper-parameters used for all the classifiers were manually assigned. Results show that all the presented ML algorithms performed well (all exceeded 90% test accuracy) on the classification task. The MLP algorithm stands out among the implemented algorithms with a test accuracy of ~99.04%.

研究の動機と目的

良性および悪性腫瘍の二値分類を目的とした、ウィスコンシン診断乳癌（WDBC）データセット上で6つの機械学習アルゴリズムの性能を評価すること。
従来の分類器と比較して、新たに提案されたGRU-SVMモデルの有効性を同データセット上で評価すること。
標準化された70/30の訓練・テスト分割を用いた各アルゴリズムの感度、特異度、およびテスト正解率を分析すること。
線形分離可能と想定されるデータセットにおいて、非線形モデル（例：GRU-SVM）が線形モデルを上回る性能を示すかどうかを調査すること。
実世界の医用画像データを用いた乳癌診断における臨床意思決定支援のための機械学習の実証的根拠を提供すること。

提案手法

本研究では、乳癌腫瘍のデジタル化されたFNA画像から抽出された30の特徴量を有するWDBCデータセットを、訓練およびテストに用いた。
データセットは70%を訓練用、30%をテスト用に分割し、特徴量の標準化にzスコア正規化（z = (X - μ) / σ）を適用した。
GRU-SVMモデルは、ゲート付き再帰型ニューラルネットワーク（GRU）RNNと線形サポートベクターマシン（SVM）を組み合わせたもので、GRUの隠れ状態がSVM分類器の入力として使用される。
GRUのコア方程式には、更新ゲート（z）、リセットゲート（r）、候補隠れ状態（h̃t）、および最終隠れ状態（ht）が含まれ、シグモイドおよびtanh活性化関数が使用された。
SGD（確率的勾配降下法）を除く全モデルはSGDで訓練されたが、GRU-SVM、Nearest Neighbor、SVMは特別な最適化手法または訓練なしで処理された。
モデルの評価は、テスト正解率、感度、特異度を用い、ハイパーパramータは手動でチューニングされた。

実験結果

リサーチクエスチョン

RQ1WDBCデータセットを用いた場合、異なる機械学習アルゴリズムは良性および悪性乳癌腫瘍の分類においてどの程度の性能を示すか？
RQ2提案されたGRU-SVMモデルは、SVM や MLP といった既存のモデルと比較して、WDBCデータセットで競争力のある性能を達成できるか？
RQ3WDBCデータセットは線形分離可能であると想定されるが、この文脈において線形モデルが非線形モデルを上回る性能を示すか？
RQ4モデルアーキテクチャおよび訓練プロセスの影響は、分類正解率、感度、特異度にどのように現れるか？
RQ5深層学習ベースのモデル（例：MLP や GRU-SVM）は、この医用画像ベースの分類タスクにおいて優れた性能を発揮できるか？

主な発見

マルチレイヤーパーセプトロン（MLP）が約99.04%の最高テスト正解率を達成し、他の全モデルを顕著に上回った。
全6つの機械学習アルゴリズムが90%以上のテスト正解率を達成しており、WDBCデータセットにおける良好な一般化性能を示した。
L2-SVMは約96.09%のテスト正解率を達成し、60/40分割を用いた先行研究の89.28%を上回った。
GRU-SVMモデルは93.75%のテスト正解率を達成したが、これはデータ構造とのアーキテクチャの不適合により、線形分離可能なデータに対しては性能を発揮しにくくなる可能性を示唆している。
ソフトマックス回帰とL2-SVMは、それぞれ97.37%および97.73%の高い訓練正解率を示し、トレーニング中の収束性が良好であった。
最近傍探索（Nearest Neighbor）は訓練を必要としなかったため、距離を直接計算して最近傍のデータポイントを特定するのみで、訓練正解率は記録されなかった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。