QUICK REVIEW

[논문 리뷰] On Breast Cancer Detection: An Application of Machine Learning Algorithms on the Wisconsin Diagnostic Dataset

Abien Fred Agarap|arXiv (Cornell University)|2017. 11. 20.

AI in cancer detection참고 문헌 16인용 수 33

한 줄 요약

이 연구는 이분류를 위한 웨이스턴 디아그노스틱 브래스트 캐너(WDBC) 데이터셋에서 6개의 기계학습 알고리즘—특히 새로운 GRU-SVM 모델을 포함—을 평가한다. 다층 퍼셉트론(MLP)이 약 99.04%의 최고 테스트 정확도를 기록하여 모든 모델 중에서 뛰어난 성능을 보였으며, 모든 알고리즘은 90% 이상의 정확도를 확보하였다.

ABSTRACT

This paper presents a comparison of six machine learning (ML) algorithms: GRU-SVM (Agarap, 2017), Linear Regression, Multilayer Perceptron (MLP), Nearest Neighbor (NN) search, Softmax Regression, and Support Vector Machine (SVM) on the Wisconsin Diagnostic Breast Cancer (WDBC) dataset (Wolberg, Street, & Mangasarian, 1992) by measuring their classification test accuracy and their sensitivity and specificity values. The said dataset consists of features which were computed from digitized images of FNA tests on a breast mass (Wolberg, Street, & Mangasarian, 1992). For the implementation of the ML algorithms, the dataset was partitioned in the following fashion: 70% for training phase, and 30% for the testing phase. The hyper-parameters used for all the classifiers were manually assigned. Results show that all the presented ML algorithms performed well (all exceeded 90% test accuracy) on the classification task. The MLP algorithm stands out among the implemented algorithms with a test accuracy of ~99.04%.

연구 동기 및 목표

이분류를 위한 웨이스턴 디아그노스틱 브래스트 캐너(WDBC) 데이터셋에서 6개의 기계학습 알고리즘의 성능을 평가하기 위해.
기존의 분류기들과 비교하여 새로 제안된 GRU-SVM 모델의 효과성을 평가하기 위해.
표준화된 70/30 훈련-테스트 분할 조건 하에서 각 알고리즘의 민감도, 특이도 및 테스트 정확도를 분석하기 위해.
비선형 모델인 GRU-SVM이 선형으로 분리 가능하다고 여겨지는 데이터셋에서 선형 모델을 능가하는지 조사하기 위해.
실제 의료 영상 데이터를 기반으로 한 유방암 진단의 임상적 의사결정 지원을 위한 기계학습의 실증적 근거를 제공하기 위해.

제안 방법

30개의 특징을 포함하는 디지타이징된 FNA 영상에서 유도된 웨이스턴 디아그노스틱 브래스트 캐너(WDBC) 데이터셋을 훈련 및 테스트에 사용하였다.
데이터셋은 70% 훈련 및 30% 테스트 세트로 분할되었으며, 특징 표준화는 z-스코어 정규화(z = (X - μ) / σ)를 적용하였다.
GRU-SVM 모델은 게이트드 리커런트 유닛(GRU) RNN과 선형 서포트 벡터 머신(SVM)을 조합한 것으로, GRU의 은닉 상태가 SVM 분류기의 입력으로 사용된다.
GRU의 핵심 수식은 업데이트 게이트(z), 리셋 게이트(r), 후보 은닉 상태(ĥt), 최종 은닉 상태(ht)이며, 시그모이드 및 탄제이 활성화 함수를 사용한다.
SGD는 GRU-SVM, K-최근접 이웃, SVM 이외의 모든 모델을 훈련하는 데 사용되었으며, 이들 외의 모델은 특수 최적화 또는 훈련 없이 처리되었다.
모델 평가는 테스트 정확도, 민감도, 특이도를 사용하였으며, 하이퍼파ram터는 수동으로 튜닝되었다.

실험 결과

연구 질문

RQ1WDBC 데이터셋을 사용하여 다양한 기계학습 알고리즘이 양성 및 악성 유방 종양을 어떻게 분류하는가?
RQ2제안된 GRU-SVM 모델은 SVM 및 MLP와 같은 기존 모델들과 비교하여 경쟁 가능한 성능을 달성하는가?
RQ3WDBC 데이터셋은 선형으로 분리 가능한가? 이 경우 선형 모델이 비선형 모델보다 우수한가?
RQ4모델 아키텍처와 훈련 절차가 분류 정확도, 민감도, 특이도에 어떤 영향을 미치는가?
RQ5딥러닝 기반 모델인 MLP와 GRU-SVM은 이 의료 영상 기반 분류 과제에서 뛰어난 성능을 낼 수 있는가?

주요 결과

다층 퍼셉트론(MLP)이 약 99.04%의 최고 테스트 정확도를 기록하여 모든 다른 모델을 크게 앞섰다.
6개의 기계학습 알고리즘이 모두 90% 이상의 테스트 정확도를 확보하여 WDBC 데이터셋에서 뛰어난 일반화 성능를 보였다.
L2-SVM는 약 96.09%의 테스트 정확도를 기록하여 이전 연구에서 60/40 분할을 사용한 89.28%보다 뛰어났다.
GRU-SVM 모델은 93.75%의 테스트 정확도를 기록하여, 데이터의 선형 분리 가능성과 모델 아키텍처 간의 부적합성으로 인해 성능이 저하될 수 있음을 시사하였다.
소프트맥스 회귀와 L2-SVM는 각각 97.37% 및 97.73%의 높은 훈련 정확도를 보였으며, 이는 훈련 과정에서 강력한 수렴을 보였음을 나타낸다.
K-최근접 이웃 검색은 훈련이 필요 없었으며, 근접한 데이터 포인트까지의 거리를 직접 계산했기 때문에 훈련 정확도가 기록되지 않았다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.