Skip to main content
QUICK REVIEW

[論文レビュー] Spatio-Temporal Data Mining: A Survey of Problems and Methods

Gowtham Atluri, Anuj Karpatne|arXiv (Cornell University)|Nov 13, 2017
Data Management and Algorithms参考文献 245被引用数 86
ひとこと要約

この調査は時空間データマイニング(STDM)の問題と手法を整理し、文献を六カテゴリに分類し、STデータのタイプ、インスタンス、課題を詳述する。

ABSTRACT

Large volumes of spatio-temporal data are increasingly collected and studied in diverse domains including, climate science, social sciences, neuroscience, epidemiology, transportation, mobile health, and Earth sciences. Spatio-temporal data differs from relational data for which computational approaches are developed in the data mining community for multiple decades, in that both spatial and temporal attributes are available in addition to the actual measurements/attributes. The presence of these attributes introduces additional challenges that needs to be dealt with. Approaches for mining spatio-temporal data have been studied for over a decade in the data mining community. In this article we present a broad survey of this relatively young field of spatio-temporal data mining. We discuss different types of spatio-temporal data and the relevant data mining questions that arise in the context of analyzing each of these datasets. Based on the nature of the data mining problem studied, we classify literature on spatio-temporal data mining into six major categories: clustering, predictive learning, change detection, frequent pattern mining, anomaly detection, and relationship mining. We discuss the various forms of spatio-temporal data mining problems in each of these categories.

研究の動機と目的

  • 時空間データマイニング (STDM) の景観を定義し、さまざまな領域での研究の動機付けを行う。
  • STデータタイプ、インスタンス、および類似度測度の包括的な分類法を提供する。
  • コア問題カテゴリ(クラスタリング、予測学習、変化検知、頻繁パターンマイニング、異常検知、リレーションシップマイニング)に基づいて整理されたSTDMアプローチを調査する。
  • 空間的および時間的依存性(自己相関)と不均一性がSTDMの手法と評価にどのように影響するかを強調する。

提案手法

  • 多様な分野(気候科学、神経科学、疫学、交通、地球科学)からのSTDMに関する文献をレビューし、統合する。
  • データマイニング課題の性質に基づいて、STDM文献を6つの主要な問題カテゴリに分類する。
  • データタイプ(イベント、軌跡、点参照、ラスタ)とデータインスタンスの定義(ポイント、軌跡、時系列、空間マップ、STラスタ)を説明する。
  • モデリングと評価のためのSTデータにおける自己相関と非定常性がもたらす課題を説明する。
  • 異なるSTDMツールを活用するためのSTデータタイプ間のデータ変換を検討する。
  • データタイプ、インスタンス定義、類似度測度、STDMタスクを結ぶフレームワークを提示する。

実験結果

リサーチクエスチョン

  • RQ1STDMの定式化を推進する時空間データの基本的なデータタイプと表現とは何か。
  • RQ2自己相関や不均一性などのSTの特性がモデリングの選択と評価にどのように影響するか。
  • RQ3主要なSTDM問題カテゴリは何か、文献をどのように整理すると共通点と相違点が明らかになるか。
  • RQ4STデータをタイプ間で変換して、STDM手法の分野横断的な適用を可能にするにはどうすればよいか。

主な発見

  • 時空間データのSTデータマイニングは、意味のある6つの問題領域に分類できる:クラスタリング、予測学習、変化検知、頻繁パターンマイニング、異常検知、リレーションシップマイニング。
  • イベント、軌跡、点参照、ラスタなどのSTデータタイプの豊富な分類と、データインスタンスの定義方法が複数存在し、問題定式化に影響を与える。
  • 自己相関と不均一性は、従来のデータマイニングの仮定と評価手法を難しくし、特殊なSTDMアプローチを必要とする。
  • STデータは空間情報と時間情報を結びつけることで新しい問題定式化を可能にし、手法と洞察の分野横断的な移転を促進する。
  • 統一されたフレームワークと調査は古典的なデータマイニングとSTDMを橋渡しし、研究者がデータに適した定式化を選択するのを導く。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。