[论文解读] Spatio-Temporal Data Mining: A Survey of Problems and Methods
本综述将时空数据挖掘(STDM)问题与方法映射,将文献分为六个类别,并详细介绍时空数据的类型、实例及挑战。
Large volumes of spatio-temporal data are increasingly collected and studied in diverse domains including, climate science, social sciences, neuroscience, epidemiology, transportation, mobile health, and Earth sciences. Spatio-temporal data differs from relational data for which computational approaches are developed in the data mining community for multiple decades, in that both spatial and temporal attributes are available in addition to the actual measurements/attributes. The presence of these attributes introduces additional challenges that needs to be dealt with. Approaches for mining spatio-temporal data have been studied for over a decade in the data mining community. In this article we present a broad survey of this relatively young field of spatio-temporal data mining. We discuss different types of spatio-temporal data and the relevant data mining questions that arise in the context of analyzing each of these datasets. Based on the nature of the data mining problem studied, we classify literature on spatio-temporal data mining into six major categories: clustering, predictive learning, change detection, frequent pattern mining, anomaly detection, and relationship mining. We discuss the various forms of spatio-temporal data mining problems in each of these categories.
研究动机与目标
- 定义时空数据挖掘(STDM)的全景并在各领域推进其研究。
- 提供对 ST 数据类型、实例和相似性度量的全面分类。
- 围绕核心问题类别(聚类、预测学习、变化检测、频繁模式挖掘、异常检测、关系挖掘)对 STDM 方法进行分类综述。
- 强调时空依赖性(自相关)与异质性如何影响 STDM 方法与评估。
提出的方法
- 综述并综合来自不同领域(气候科学、神经科学、流行病学、交通、地球科学)的 STDM 文献。
- 基于数据挖掘任务的性质,将 STDM 文献分为六大主要问题类别。
- 描述数据类型(事件、轨迹、点参考、栅格)以及数据实例定义(点、轨迹、时间序列、空间地图、ST 栅格)。
- 解释时空数据中的自相关性与非平稳性对建模和评估提出的挑战。
- 讨论在时空数据类型之间转换数据以便利用不同的 STDM 工具。
- 提出一个框架,将数据类型、实例定义、相似性度量与 STDM 任务联系起来。
实验结果
研究问题
- RQ1时空数据中推动 STDM 形式化的基本数据类型和表示是什么?
- RQ2时空属性如自相关性和异质性如何影响建模选择与评估?
- RQ3主要的 STDM 问题类别有哪些,以及如何组织文献以揭示共同点与差异?
- RQ4如何在不同类型之间转换 ST 数据以实现跨领域应用 STDM 方法?
主要发现
- 时空数据的 ST 数据挖掘可以被有意义地分为六个问题领域:聚类、预测学习、变化检测、频繁模式挖掘、异常检测和关系挖掘。
- 存在丰富的 ST 数据类型分类(事件、轨迹、点参考、栅格)以及定义数据实例的多种方式,这会影响问题的表述。
- 在时空中的自相关性和异质性挑战传统数据挖掘的假设和评估方法,因此需要专门的 STDM 方法。
- 时空数据通过耦合空间和时间信息,能够推动新颖的问题表述,促进方法和洞见的跨领域转移。
- 一个统一的框架和综述可以连接经典数据挖掘与 STDM,指导研究人员为其数据选择合适的表述。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。