Skip to main content
QUICK REVIEW

[논문 리뷰] Gradient Boosting Decision Trees on Medical Diagnosis over Tabular Data

Aytaç Yıldız, Arzu Kalaycı|arXiv (Cornell University)|2024. 09. 25.
Artificial Intelligence in Healthcare인용 수 6
한 줄 요약

이 논문은 Gradient Boosting Decision Trees (LightGBM, XGBoost, CatBoost)가 전통 ML 및 표 형식 DL 모델을 7개 의료 표형 데이터셋에서 우수하게 수행하며, 훈련 시간이 우호적임을 경험적으로 보여준다.

ABSTRACT

Medical diagnosis is a crucial task in the medical field, in terms of providing accurate classification and respective treatments. Having near-precise decisions based on correct diagnosis can affect a patient's life itself, and may extremely result in a catastrophe if not classified correctly. Several traditional machine learning (ML), such as support vector machines (SVMs) and logistic regression, and state-of-the-art tabular deep learning (DL) methods, including TabNet and TabTransformer, have been proposed and used over tabular medical datasets. Additionally, due to the superior performances, lower computational costs, and easier optimization over different tasks, ensemble methods have been used in the field more recently. They offer a powerful alternative in terms of providing successful medical decision-making processes in several diagnosis tasks. In this study, we investigated the benefits of ensemble methods, especially the Gradient Boosting Decision Tree (GBDT) algorithms in medical classification tasks over tabular data, focusing on XGBoost, CatBoost, and LightGBM. The experiments demonstrate that GBDT methods outperform traditional ML and deep neural network architectures and have the highest average rank over several benchmark tabular medical diagnosis datasets. Furthermore, they require much less computational power compared to DL models, creating the optimal methodology in terms of high performance and lower complexity.

연구 동기 및 목표

  • 다양한 표 형식 의료 진단 데이터셋에서 GBDT 모델(XGBoost, LightGBM, CatBoost)의 성능을 평가한다.
  • GBDT를 전통 ML 및 최첨단 표 형식 DL 모델과 비교한다.
  • 실용적 임상 배치를 위한 학습 시간과 성능의 trade-off를 분석한다.
  • 데이터셋 규모와 특성에 따른 의료 표 형식 데이터에 대한 모델 선택에 대한 가이드를 제공한다.

제안 방법

  • 범주형에 대한 서수 인코딩으로 데이터 전처리하고 수치 특성은 표준화한다.
  • ROC AUC를 지표로 5개의 전통 ML 모델, 5개의 DL 모델, 4개의 앙상블 모델(3개의 GBDT)을 평가한다.
  • 일반화 능력을 평가하기 위해 8배 계층적 교차검증을 수행한다.
  • 하이퍼파라미터 최적화: 각 모델당 평균 ROC AUC를 교차검증 fold를 기준으로 약 36개 조합을 평가한다.
  • 성능 및 평균 훈련 시간 측면에서 모델을 비교한다.

실험 결과

연구 질문

  • RQ1GBDT 모델이 다양한 의료 데이터셋에서 전통 ML 및 표 형식 DL 모델보다 더 높은 ROC AUC를 달성하는가?
  • RQ2어떤 GBDT 구현(XGBoost, LightGBM, CatBoost)이 성능과 훈련 시간 간의 최적의 균형을 제공하는가?
  • RQ3의료 표 형식 데이터에서 데이터셋의 크기와 특징 차원수에 따라 모델 성능은 어떻게 변화하는가?
  • RQ4정확도와 효율성을 바탕으로 임상 의사결정 지원에서의 모델 선택에 실용적 시사점은 무엇인가?

주요 결과

모델CD심부전파킨슨병EEG 눈 상태눈 움직임Arcene전립선Avg. Rank
SVM78.715 ± 0.00586.389 ± 0.04888.791 ± 0.06870.752 ± 0.01378.405 ± 0.00787.094 ± 0.04391.419 ± 0.0969.857
로지스틱 회귀78.435 ± 0.00587.571 ± 0.05190.875 ± 0.04161.125 ± 0.01471.180 ± 0.00995.211 ± 0.03195.089 ± 0.0658.143
KNN69.611 ± 0.00677.529 ± 0.06796.857 ± 0.02391.185 ± 0.00572.448 ± 0.00990.869 ± 0.06587.822 ± 0.1129.857
Random Forest77.464 ± 0.00591.233 ± 0.03896.068 ± 0.03398.404 ± 0.00287.234 ± 0.00791.153 ± 0.03493.155 ± 0.0786.000
결정 트리63.325 ± 0.00671.646 ± 0.05181.287 ± 0.06083.781 ± 0.00870.951 ± 0.00972.037 ± 0.11680.357 ± 0.10612.714
LDA70.363 ± 0.00587.896 ± 0.05388.609 ± 0.06067.130 ± 0.01471.273 ± 0.01069.927 ± 0.12493.849 ± 0.06010.571
MLP [60]80.090 ± 0.00587.288 ± 0.05697.186 ± 0.02295.513 ± 0.00673.397 ± 0.01593.669 ± 0.04289.881 ± 0.1086.429
STG [37]79.667 ± 0.00486.241 ± 0.05895.352 ± 0.03884.854 ± 0.01180.780 ± 0.00690.584 ± 0.06294.048 ± 0.0947.857
TabNet [9]77.757 ± 0.00493.319 ± 0.03799.446 ± 0.01262.441 ± 0.04087.673 ± 0.00887.662 ± 0.09866.865 ± 0.2057.429
TabTransformer [36]71.327 ± 0.12387.642 ± 0.06996.625 ± 0.02779.646 ± 0.03970.534 ± 0.01094.724 ± 0.05192.956 ± 0.1078.571
VIME [38]78.882 ± 0.00485.758 ± 0.04798.532 ± 0.01692.473 ± 0.00581.918 ± 0.00891.721 ± 0.07052.679 ± 0.1647.429
XGBoost [49]79.745 ± 0.00490.478 ± 0.02597.265 ± 0.02398.331 ± 0.00289.675 ± 0.00889.123 ± 0.04794.940 ± 0.0554.429
LightGBM [50]80.296 ± 0.00491.490 ± 0.02798.623 ± 0.01597.008 ± 0.00489.059 ± 0.00791.883 ± 0.04395.486 ± 0.0522.571
CatBoost [51]80.378 ± 0.00491.056 ± 0.03497.740 ± 0.01497.739 ± 0.00388.954 ± 0.00691.396 ± 0.04096.379 ± 0.0533.143
  • GBDT 모델은 7개 데이터셋 전반에서 전통 ML 및 최첨단 표 형식 DL 모델을 일관되게 능가한다.
  • LightGBM은 평가된 모델들 중 평균 ROC AUC와 훈련 시간 면에서 종종 최고 성과를 보인다.
  • 평균적으로 GBDT는 DL 아키텍처에 비해 계산 비용이 낮으면서도 우수한 성능을 제공한다.
  • 모델들 중 최상위 GBDT 변형은 데이터셋에 따라 다르지만 LightGBM이 자주 높은 순위를 차지하고 전반적인 지표가 강하다.
  • DL 모델은 모델 복잡성으로 인해 훈련 시간이 더 긴 경향이 있으며, 반면 GBDT는 정확도와 효율성 사이의 균형을 이룬다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.