Skip to main content
QUICK REVIEW

[논문 리뷰] Spatio-Temporal Data Mining: A Survey of Problems and Methods

Gowtham Atluri, Anuj Karpatne|arXiv (Cornell University)|2017. 11. 13.
Data Management and Algorithms참고 문헌 245인용 수 86
한 줄 요약

이 고찰은 시공간 데이터 마이닝(STDM) 문제와 방법을 매핑하고, 문헌을 여섯 가지 범주로 분류하며 ST 데이터 유형, 사례 및 도전에 대해 자세히 설명한다.

ABSTRACT

Large volumes of spatio-temporal data are increasingly collected and studied in diverse domains including, climate science, social sciences, neuroscience, epidemiology, transportation, mobile health, and Earth sciences. Spatio-temporal data differs from relational data for which computational approaches are developed in the data mining community for multiple decades, in that both spatial and temporal attributes are available in addition to the actual measurements/attributes. The presence of these attributes introduces additional challenges that needs to be dealt with. Approaches for mining spatio-temporal data have been studied for over a decade in the data mining community. In this article we present a broad survey of this relatively young field of spatio-temporal data mining. We discuss different types of spatio-temporal data and the relevant data mining questions that arise in the context of analyzing each of these datasets. Based on the nature of the data mining problem studied, we classify literature on spatio-temporal data mining into six major categories: clustering, predictive learning, change detection, frequent pattern mining, anomaly detection, and relationship mining. We discuss the various forms of spatio-temporal data mining problems in each of these categories.

연구 동기 및 목표

  • 시공간 데이터 마이닝(STDM)의 전개를 정의하고 다양한 분야에서의 연구 필요성을 제시한다.
  • ST 데이터 유형, 인스턴스 및 유사도 측정의 포괄적 분류 체계를 제공한다.
  • 핵심 문제 범주(클러스터링, 예측 학습, 변화 탐지, 빈번한 패턴 마이닝, 이상 탐지, 관계 마이닝)를 중심으로 구성된 STDM 접근 방식에 대한 조사를 수행한다.
  • 공간적·시간적 의존성(자기상관)과 이질성이 STDM 방법과 평가에 어떤 영향을 미치는지 강조한다.

제안 방법

  • 다양한 분야(기후과학, 신경과학, 역학, 교통, 지구 과학)에서의 STDM에 관한 문헌을 검토하고 종합한다.
  • 데이터 마이닝 작업의 성격에 따라 STDM 문헌을 여섯 가지 주요 문제 범주로 분류한다.
  • 데이터 유형(이벤트, 궤적, 점 기준, 래스터)과 데이터 인스턴스 정의(포인트, 궤적, 시계열, 공간 맵, ST 래스터)를 설명한다.
  • 모델링과 평가를 위한 ST 데이터의 자기상관 및 비정상성으로 인한 도전과제를 설명한다.
  • 다양한 STDM 도구를 활용하기 위한 ST 데이터 유형 간의 데이터 변환에 대해 논의한다.
  • 데이터 유형, 인스턴스 정의, 유사도 측정, STDM 작업을 연결하는 프레임워크를 제시한다.

실험 결과

연구 질문

  • RQ1STDM 형식을 추진하는 시공간 데이터의 기본 데이터 유형과 표현은 무엇인가?
  • RQ2자기상관 및 이질성과 같은 ST 특성이 모델링 선택과 평가에 어떤 영향을 미치는가?
  • RQ3주요 STDM 문제 범주는 무엇이며, 문헌을 어떻게 조직하여 공통점과 차이점을 드러낼 수 있는가?
  • RQ4ST 데이터를 유형 간에 변환하여 교차 도메인 적용이 가능하도록 하려면 어떻게 해야 하는가?

주요 결과

  • 시공간 데이터에 대한 ST 데이터 마이닝은 의미 있게 여섯 가지 문제 영역으로 분류될 수 있다: 클러스터링, 예측 학습, 변화 탐지, 빈번한 패턴 마이닝, 이상 탐지, 관계 마이닝.
  • 사건(Event), 궤적(Trajectories), 점 참조(Point references), 래스터(Rasters) 등 ST 데이터 유형의 풍부한 분류체계와 데이터를 인스턴스 정의하는 여러 방법이 문제 공식화에 영향을 준다.
  • 공간과 시간의 자기상관 및 이질성은 전통적인 데이터 마이닝 가정과 평가 방법에 도전하며, 특화된 STDM 접근이 필요하다.
  • ST 데이터는 공간 정보와 시간 정보를 결합하여 새로운 문제 형식을 가능하게 하며, 방법과 인사이트의 교차 도메인 전이를 촉진한다.
  • 일원화된 프레임워크와 연구 조사는 고전적 데이터 마이닝과 STDM을 연결하여 연구자들이 데이터에 적합한 형식을 선택하도록 안내할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.