[论文解读] Once Upon a Crime: Towards Crime Prediction from Demographics and Mobile Data
本文提出一种数据驱动方法,利用汇总的、匿名化的手机数据和人口统计数据,预测伦敦的犯罪热点。通过建模人类行为模式与城市动态,该方法在提前一个月预测高犯罪或低犯罪区域方面实现了69.8%的准确率,优于传统统计方法,且使用更少、更具动态性的特征。
In this paper, we present a novel approach to predict crime in a geographic space from multiple data sources, in particular mobile phone and demographic data. The main contribution of the proposed approach lies in using aggregated and anonymized human behavioral data derived from mobile network activity to tackle the crime prediction problem. While previous research efforts have used either background historical knowledge or offenders' profiling, our findings support the hypothesis that aggregated human behavioral data captured from the mobile network infrastructure, in combination with basic demographic information, can be used to predict crime. In our experimental results with real crime data from London we obtain an accuracy of almost 70% when predicting whether a specific area in the city will be a crime hotspot or not. Moreover, we provide a discussion of the implications of our findings for data-driven crime analysis.
研究动机与目标
- 探究汇总的移动网络活动与人口统计数据是否能够预测城市区域的犯罪热点。
- 开发一种数据驱动模型,预测特定地理区域的犯罪水平,而无需完全依赖历史犯罪数据。
- 比较基于移动数据提取的特征与传统社会经济统计数据在预测性能上的差异。
- 识别出超越静态人口统计指标的新型、动态的城市区域特征,这些特征与犯罪风险相关。
提出的方法
- 本研究使用匿名化且汇总的手机数据,提取如基于家庭的活动和移动模式的熵等行为特征。
- 将官方行政区统计数据中的人口数据与移动数据提取的特征相结合,以表征城市区域的社会空间特征。
- 训练机器学习分类器,以预测某一地理区域在未来一个月是否会出现高犯罪或低犯罪水平。
- 进行特征选择,以识别最具预测力的变量,包括移动熵和居住活动强度。
- 使用伦敦的真实犯罪数据(按月汇总)对模型进行评估,并与仅使用官方统计数据的基线模型进行比较。
- 该方法将犯罪预测视为二分类问题:高犯罪区域 vs. 低犯罪区域。
实验结果
研究问题
- RQ1与传统的人口统计和经济社会指标相比,汇总的手机数据是否能提高犯罪预测的准确率?
- RQ2从移动网络活动中提取的哪些行为特征最能预测城市区域未来的犯罪水平?
- RQ3与静态的人口统计资料相比,纳入动态的人类移动模式在识别犯罪热点方面有何增强作用?
- RQ4在历史犯罪率较低的区域,手机数据在多大程度上能够预测犯罪?
- RQ5使用移动网络数据进行前瞻性犯罪预防具有哪些理论与实际意义?
主要发现
- 所提出的模型在提前一个月区分伦敦高犯罪与低犯罪区域方面实现了69.8%的预测准确率。
- 尽管使用特征更少,该模型仍比仅使用官方统计数据的基线方法高出6个百分点的准确率。
- 基于家庭的活动和移动熵被确定为最具预测力的特征,表明人类存在与移动模式是犯罪风险的强指标。
- 结果支持了以下假设:汇总的手机数据能够捕捉与犯罪发生相关的有意义的行为动态,即使在近期无犯罪的区域亦然。
- 该方法可实现对潜在犯罪热点的早期识别,有助于前瞻性警务和城市规划。
- 本研究证明,移动网络数据可作为实时城市风险评估的低成本、可扩展的代理指标。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。