Skip to main content
QUICK REVIEW

[논문 리뷰] On Breast Cancer Detection: An Application of Machine Learning Algorithms on the Wisconsin Diagnostic Dataset

Abien Fred Agarap|arXiv (Cornell University)|2017. 11. 20.
AI in cancer detection참고 문헌 16인용 수 33
한 줄 요약

이 연구는 이분류를 위한 웨이스턴 디아그노스틱 브래스트 캐너(WDBC) 데이터셋에서 6개의 기계학습 알고리즘—특히 새로운 GRU-SVM 모델을 포함—을 평가한다. 다층 퍼셉트론(MLP)이 약 99.04%의 최고 테스트 정확도를 기록하여 모든 모델 중에서 뛰어난 성능을 보였으며, 모든 알고리즘은 90% 이상의 정확도를 확보하였다.

ABSTRACT

This paper presents a comparison of six machine learning (ML) algorithms: GRU-SVM (Agarap, 2017), Linear Regression, Multilayer Perceptron (MLP), Nearest Neighbor (NN) search, Softmax Regression, and Support Vector Machine (SVM) on the Wisconsin Diagnostic Breast Cancer (WDBC) dataset (Wolberg, Street, & Mangasarian, 1992) by measuring their classification test accuracy and their sensitivity and specificity values. The said dataset consists of features which were computed from digitized images of FNA tests on a breast mass (Wolberg, Street, & Mangasarian, 1992). For the implementation of the ML algorithms, the dataset was partitioned in the following fashion: 70% for training phase, and 30% for the testing phase. The hyper-parameters used for all the classifiers were manually assigned. Results show that all the presented ML algorithms performed well (all exceeded 90% test accuracy) on the classification task. The MLP algorithm stands out among the implemented algorithms with a test accuracy of ~99.04%.

연구 동기 및 목표

  • 이분류를 위한 웨이스턴 디아그노스틱 브래스트 캐너(WDBC) 데이터셋에서 6개의 기계학습 알고리즘의 성능을 평가하기 위해.
  • 기존의 분류기들과 비교하여 새로 제안된 GRU-SVM 모델의 효과성을 평가하기 위해.
  • 표준화된 70/30 훈련-테스트 분할 조건 하에서 각 알고리즘의 민감도, 특이도 및 테스트 정확도를 분석하기 위해.
  • 비선형 모델인 GRU-SVM이 선형으로 분리 가능하다고 여겨지는 데이터셋에서 선형 모델을 능가하는지 조사하기 위해.
  • 실제 의료 영상 데이터를 기반으로 한 유방암 진단의 임상적 의사결정 지원을 위한 기계학습의 실증적 근거를 제공하기 위해.

제안 방법

  • 30개의 특징을 포함하는 디지타이징된 FNA 영상에서 유도된 웨이스턴 디아그노스틱 브래스트 캐너(WDBC) 데이터셋을 훈련 및 테스트에 사용하였다.
  • 데이터셋은 70% 훈련 및 30% 테스트 세트로 분할되었으며, 특징 표준화는 z-스코어 정규화(z = (X - μ) / σ)를 적용하였다.
  • GRU-SVM 모델은 게이트드 리커런트 유닛(GRU) RNN과 선형 서포트 벡터 머신(SVM)을 조합한 것으로, GRU의 은닉 상태가 SVM 분류기의 입력으로 사용된다.
  • GRU의 핵심 수식은 업데이트 게이트(z), 리셋 게이트(r), 후보 은닉 상태(ĥt), 최종 은닉 상태(ht)이며, 시그모이드 및 탄제이 활성화 함수를 사용한다.
  • SGD는 GRU-SVM, K-최근접 이웃, SVM 이외의 모든 모델을 훈련하는 데 사용되었으며, 이들 외의 모델은 특수 최적화 또는 훈련 없이 처리되었다.
  • 모델 평가는 테스트 정확도, 민감도, 특이도를 사용하였으며, 하이퍼파ram터는 수동으로 튜닝되었다.

실험 결과

연구 질문

  • RQ1WDBC 데이터셋을 사용하여 다양한 기계학습 알고리즘이 양성 및 악성 유방 종양을 어떻게 분류하는가?
  • RQ2제안된 GRU-SVM 모델은 SVM 및 MLP와 같은 기존 모델들과 비교하여 경쟁 가능한 성능을 달성하는가?
  • RQ3WDBC 데이터셋은 선형으로 분리 가능한가? 이 경우 선형 모델이 비선형 모델보다 우수한가?
  • RQ4모델 아키텍처와 훈련 절차가 분류 정확도, 민감도, 특이도에 어떤 영향을 미치는가?
  • RQ5딥러닝 기반 모델인 MLP와 GRU-SVM은 이 의료 영상 기반 분류 과제에서 뛰어난 성능을 낼 수 있는가?

주요 결과

  • 다층 퍼셉트론(MLP)이 약 99.04%의 최고 테스트 정확도를 기록하여 모든 다른 모델을 크게 앞섰다.
  • 6개의 기계학습 알고리즘이 모두 90% 이상의 테스트 정확도를 확보하여 WDBC 데이터셋에서 뛰어난 일반화 성능를 보였다.
  • L2-SVM는 약 96.09%의 테스트 정확도를 기록하여 이전 연구에서 60/40 분할을 사용한 89.28%보다 뛰어났다.
  • GRU-SVM 모델은 93.75%의 테스트 정확도를 기록하여, 데이터의 선형 분리 가능성과 모델 아키텍처 간의 부적합성으로 인해 성능이 저하될 수 있음을 시사하였다.
  • 소프트맥스 회귀와 L2-SVM는 각각 97.37% 및 97.73%의 높은 훈련 정확도를 보였으며, 이는 훈련 과정에서 강력한 수렴을 보였음을 나타낸다.
  • K-최근접 이웃 검색은 훈련이 필요 없었으며, 근접한 데이터 포인트까지의 거리를 직접 계산했기 때문에 훈련 정확도가 기록되지 않았다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.