Skip to main content
QUICK REVIEW

[논문 리뷰] Numerical Association Rule Mining: A Systematic Literature Review

Minakshi Kaushik, Rahul Sharma|arXiv (Cornell University)|2023. 07. 02.
Data Mining Algorithms and Applications인용 수 7
한 줄 요약

이 논문은 1996년부터 2022년까지 Numerical Association Rule Mining(NARM)에 대한 체계적 문헌 고찰(SLR)을 수행하고 1,140편의 기사에서 68편의 최종 연구를 식별하며 새로운 이산화 척도를 도입한다.

ABSTRACT

Numerical association rule mining is a widely used variant of the association rule mining technique, and it has been extensively used in discovering patterns and relationships in numerical data. Initially, researchers and scientists integrated numerical attributes in association rule mining using various discretization approaches; however, over time, a plethora of alternative methods have emerged in this field. Unfortunately, the increase of alternative methods has resulted into a significant knowledge gap in understanding diverse techniques employed in numerical association rule mining -- this paper attempts to bridge this knowledge gap by conducting a comprehensive systematic literature review. We provide an in-depth study of diverse methods, algorithms, metrics, and datasets derived from 1,140 scholarly articles published from the inception of numerical association rule mining in the year 1996 to 2022. In compliance with the inclusion, exclusion, and quality evaluation criteria, 68 papers were chosen to be extensively evaluated. To the best of our knowledge, this systematic literature review is the first of its kind to provide an exhaustive analysis of the current literature and previous surveys on numerical association rule mining. The paper discusses important research issues, the current status, and future possibilities of numerical association rule mining. On the basis of this systematic review, the article also presents a novel discretization measure that contributes by providing a partitioning of numerical data that meets well human perception of partitions.

연구 동기 및 목표

  • 1996년부터 2022년까지 NARM 문헌을 매핑하기 위한 엄격한 SLR 프로토콜 정의.
  • NARM에서 사용된 방법, 알고리즘, 지표 및 데이터셋를 카탈로그화.
  • 기존 NARM 연구의 강점, 한계 및 공백 식별.
  • 개 수치 partitions 인간의 지각과 일치시키는 새로운 이산화 척도 제안.
  • 미래 연구 방향 및 NARM 연구자들을 위한 실용적 지침 제공.

제안 방법

  • SLR 계획, 수행, 보고를 위한 Kitchenham과 Charters 지침을 따름.
  • 영어 논문(1996–2022)을 대상으로 ACM DL, Scopus, SpringerLink, IEEE Xplore, ScienceDirect 및 Google Scholar 검색.
  • 포함/배제 기준(I1–I5)을 적용하여 주요 연구를 선택하고 품질 평가(QQ1–QQ5)를 수행.
  • 논문별 데이터 추출(제목, 저자, 출처, 연도, 유형, 데이터셋, 목표, 지표).
  • NARM 방법을 분류하고 새로운 이산화 척도를 식별하기 위해 발견 내용 합성.
  • 발견 내용을 보고하고 타당성 위협과 향후 시각에 대해 논의.
Figure 1 . Metrics Used to Evaluate NARM Algorithms.
Figure 1 . Metrics Used to Evaluate NARM Algorithms.

실험 결과

연구 질문

  • RQ1RQ1: NARM 문제를 해결하기 위한 방법은 무엇인가?
  • RQ2RQ2: 기존 NARM 방법 각각에 대해 이용 가능한 여러 알고리즘은 무엇인가?
  • RQ3RQ3: 기존 NARM 방법의 장점과 한계는 무엇인가?
  • RQ4RQ4: 여러 기존 다목적 최적화 NARM 알고리즘은 어떤 목적을 고려하는가?
  • RQ5RQ5: NARM 알고리즘을 평가하기 위한 지표는 무엇인가?
  • RQ6RQ6: NARM 방법이 실험에 사용하는 데이터셋은 무엇인가?
  • RQ7RQ7: NARM 영역의 잠재적 향후 전망은 무엇인가?
  • RQ8RQ8: NARM의 수치 속성의 이산화를 유용한(자연스러운) 방식으로 자동화하는 방법은 무엇인가?

주요 결과

  • 4가지 주요 NARM 방법으로 이산화, 클러스터링, 퍼지, 하이브리드 접근법 식별.
  • 최적화 방법(생물 영감 및 물리 기반)이 두드러지며 진화 및 군집 지능 기법의 광범위한 활용.
  • 1,140편의 선별 기사(1996–2022) 중 68편의 기사가 최종 검토를 위한 품질 기준에 부합.
  • 본 연구는 수치 데이터의 인간 지각에 맞추어 파티션을 정렬하는 자동 이산화 척도를 도입.
  • 이전 조사는 범위가 제한적이었으며, 이 SLR은 NARM 문헌과 격차에 대한 포괄적이고 체계적 개요를 제공.
  • 기사에서는 NARM 기술의 향후 연구 방향 및 잠재적 개선점을 제시.
Figure 2 . Distribution of Metrics Used in NARM Methods.
Figure 2 . Distribution of Metrics Used in NARM Methods.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.