Skip to main content
QUICK REVIEW

[논문 리뷰] A Review of Machine Learning Techniques in Imbalanced Data and Future Trends

Elaheh Jafarigol, Theodore B. Trafali̇s|arXiv (Cornell University)|2023. 10. 11.
Imbalanced Data Classification Techniques인용 수 8
한 줄 요약

본 논문은 불균형 데이터에 대한 기술을 258편의 동료 심사 논문을 검토하고 연구자와 실무자에게 구조화된 지침과 향후 추세를 제공한다.

ABSTRACT

For over two decades, detecting rare events has been a challenging task among researchers in the data mining and machine learning domain. Real-life problems inspire researchers to navigate and further improve data processing and algorithmic approaches to achieve effective and computationally efficient methods for imbalanced learning. In this paper, we have collected and reviewed 258 peer-reviewed papers from archival journals and conference papers in an attempt to provide an in-depth review of various approaches in imbalanced learning from technical and application perspectives. This work aims to provide a structured review of methods used to address the problem of imbalanced data in various domains and create a general guideline for researchers in academia or industry who want to dive into the broad field of machine learning using large-scale imbalanced data.

연구 동기 및 목표

  • 실제 문제에서 드문 이벤트를 탐지하는 문제에 대한 해결책을 제시함으로써 연구의 필요성을 제기한다.
  • 불균형 데이터 해소를 위한 방법에 대해 도메인 전반에 걸친 심층적이고 구조화된 검토를 제공한다.
  • 대규모 불균형 데이터와 관련된 연구자와 산업계의 일반적 지침을 만들기 위해 발견을 종합한다.

제안 방법

  • 아카이브 저널과 학술대회 논문에서 258편의 동료 심사 논문을 수집하고 검토하였다.
  • 불균형 학습의 기술적 측면과 응용 관점을 다루도록 검토를 구조화하였다.
  • ML 워크플로우에서 대규모 불균형 데이터 기법을 적용하기 위한 일반 지침을 만들 목적이다.

실험 결과

연구 질문

  • RQ1다양한 도메인에서 불균형 데이터를 다루기 위한 주요 방법론적 접근법은 무엇인가?
  • RQ2이러한 불균형 학습 기법은 다양한 응용 맥락에서 어떻게 성능을 발휘하는가?
  • RQ3불균형 데이터 시나리오에서 향후 연구와 실무를 이끌기 위한 지침은 무엇인가?

주요 결과

  • 문헌은 기술적 맥락과 응용 맥락 모두에서 불균형 데이터를 다루는 다양한 기법을 포괄한다.
  • 구조화된 검토는 접근법을 통합하고 불균형 학습의 모범 사례를 명확히 하는 데 도움을 줄 수 있다.
  • 본 연구는 학계와 산업계가 불균형 데이터 기법을 채택하는 데 일반적인 지침을 제시하는 것을 목표로 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.