Skip to main content
QUICK REVIEW

[论文解读] Forecasting Crime with Deep Learning

Alexander Stec, Diego Klabjan|arXiv (Cornell University)|Jun 5, 2018
Crime Patterns and Interventions参考文献 7被引用 39
一句话总结

本文提出一种结合RNN与CNN的深度学习模型,用于在细粒度空间层面预测芝加哥和波特兰的每日犯罪数量,使用融合了天气、人口普查和公共交通数据的犯罪数据。最佳模型在芝加哥的犯罪数量分箱预测中达到75.6%的准确率,在波特兰达到65.3%,表明外部数据集显著提升了仅使用犯罪数据时的预测性能。

ABSTRACT

The objective of this work is to take advantage of deep neural networks in order to make next day crime count predictions in a fine-grain city partition. We make predictions using Chicago and Portland crime data, which is augmented with additional datasets covering weather, census data, and public transportation. The crime counts are broken into 10 bins and our model predicts the most likely bin for a each spatial region at a daily level. We train this data using increasingly complex neural network structures, including variations that are suited to the spatial and temporal aspects of the crime prediction problem. With our best model we are able to predict the correct bin for overall crime count with 75.6% and 65.3% accuracy for Chicago and Portland, respectively. The results show the efficacy of neural networks for the prediction problem and the value of using external datasets in addition to standard crime data.

研究动机与目标

  • 通过利用捕捉犯罪数据时空模式的深度神经网络,提升犯罪预测的准确性。
  • 探究外部数据集(天气、人口普查、公共交通)对犯罪预测性能的影响。
  • 在不同犯罪频率水平(低、中、高)及天气条件下评估模型性能。
  • 评估公共交通模式和日期类型(工作日、周末、节假日)对预测准确率的影响。

提出的方法

  • 采用混合RNN-CNN架构:CNN处理城市网格单元中的空间特征,RNN建模连续日期之间的时序依赖关系。
  • 将犯罪数据按每日数量划分为10个分箱,模型预测每个空间区域最可能的分箱。
  • 将外部数据集(天气、人口普查、公共交通)作为额外输入通道,以丰富特征表示。
  • 采用向前滚动验证策略进行模型训练,以模拟实时预测。
  • 通过系统性地排除数据集并测量准确率下降,评估特征重要性。
  • 在警戒区类别(低、中、高犯罪)、天气条件和日期类型(工作日、周末、节假日)下分析性能。

实验结果

研究问题

  • RQ1结合RNN与CNN的深度学习模型能否在城市区域的细粒度空间层面有效预测每日犯罪数量?
  • RQ2与仅使用犯罪数据相比,外部数据集(天气、人口普查、公共交通)在多大程度上提升了预测准确率?
  • RQ3模型性能在不同基线犯罪频率(低、中、高)的警戒区之间是否存在显著差异?
  • RQ4极端天气条件(强降水或降雪)如何影响模型的预测准确率?
  • RQ5公共交通模式和日期类型(工作日与周末/节假日)是否会影响模型性能?

主要发现

  • RNN+CNN模型在芝加哥对正确犯罪数量分箱的预测准确率达到75.6%,在波特兰达到65.3%,表现出较强的预测能力。
  • 排除外部数据集会降低模型准确率,其中人口普查数据贡献最大(下降4.1%),其次是公共交通数据(下降2.3%),天气数据贡献最小(下降0.7%)。
  • 犯罪数量持续偏低的警戒区预测最准确(总体准确率达79.3%),而中等犯罪数量警戒区的预测变异性最高。
  • 在强降水或降雪日,模型准确率略有下降,但影响较小,可能源于数据稀疏性或固有的不可预测性。
  • 包含火车站的警戒区平均比邻近警戒区准确率高1.2%,且工作日预测准确率比周末高0.9%。
  • 模型在工作日的表现优于周末或节假日,对节假日的预测准确率高出1.1%,可能是因为城市活动模式在工作日更一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。