QUICK REVIEW

[論文レビュー] Forecasting Crime with Deep Learning

Alexander Stec, Diego Klabjan|arXiv (Cornell University)|Jun 5, 2018

Crime Patterns and Interventions参考文献 7被引用数 39

ひとこと要約

本論文では、気象、インディアン・センサス、公共交通機関データを組み合わせた犯罪データを用いて、シカゴおよびポートランドの都市部で細分化された空間的スケールで日次犯罪件数を予測するためのディープラーニングモデルを提案している。最高のモデルでは、シカゴで75.6%、ポートランドで65.3%の正確性を達成し、犯罪データのみに依存する場合と比較して、外部データセットが予測性能を顕著に向上させることを示している。

ABSTRACT

The objective of this work is to take advantage of deep neural networks in order to make next day crime count predictions in a fine-grain city partition. We make predictions using Chicago and Portland crime data, which is augmented with additional datasets covering weather, census data, and public transportation. The crime counts are broken into 10 bins and our model predicts the most likely bin for a each spatial region at a daily level. We train this data using increasingly complex neural network structures, including variations that are suited to the spatial and temporal aspects of the crime prediction problem. With our best model we are able to predict the correct bin for overall crime count with 75.6% and 65.3% accuracy for Chicago and Portland, respectively. The results show the efficacy of neural networks for the prediction problem and the value of using external datasets in addition to standard crime data.

研究の動機と目的

犯罪データに内在する空間的・時間的パターンを捉える深層ニューラルネットワークを活用することで、犯罪予測の正確性を向上させること。
気象、インディアン・センサス、公共交通機関といった外部データセットが犯罪予測性能に与える影響を調査すること。
犯罪頻度レベル（低、中、高）および天候状態ごとにモデルのパフォーマンスを評価すること。
公共交通機関の利用パターンおよび日付タイプ（平日、週末、休日）が予測正確性に与える影響を評価すること。

提案手法

ハイブリッドRNN-CNNアーキテクチャを採用：CNNは都市のグリッドセルにおける空間的特徴を処理し、RNNは連続する日ごとの時間的依存関係をモデル化する。
犯罪データは日次件数に基づき10のビンに分割され、各空間的領域の最も確率の高いビンを予測する。
外部データセット（気象、インディアン・センサス、公共交通機関）を追加の入力チャネルとして統合し、特徴表現を豊かにする。
リアルタイム予測を模倣するために、ウォークフォワード検証戦略を用いてモデルを訓練する。
特徴量の重要性は、データセットを段階的に除外して正確性の低下を測定することで評価する。
ビートカテゴリ（低犯罪、中犯罪、高犯罪）、天候状態、および日付タイプ（平日、週末、休日）ごとにパフォーマンスを分析する。

実験結果

リサーチクエスチョン

RQ1RNNとCNNを組み合わせたディープラーニングモデルは、都市部における細分化された空間的スケールで日次犯罪件数を効果的に予測できるか？
RQ2気象、インディアン・センサス、公共交通機関といった外部データセットは、犯罪データのみに依存する場合と比較して、予測正確性をどの程度向上させるか？
RQ3ベースライン犯罪頻度（低、中、高）が異なるビート間でモデルのパフォーマンスに顕著な差が生じるか？
RQ4極端な天候状態（降水量や積雪量の増加）は、モデルの予測正確性にどのような影響を与えるか？
RQ5公共交通機関の利用パターンおよび日付タイプ（平日対週末／休日）は、モデルのパフォーマンスに影響を与えるか？

主な発見

RNN+CNNモデルは、シカゴで75.6%、ポートランドで65.3%の正確性を達成し、強力な予測性能を示している。
外部データセットを除外するとモデルの正確性が低下し、インディアン・センサスデータが最も寄与（4.1%の低下）、次に公共交通機関（2.3%）、気象（0.7%）の順に寄与度が高かった。
常に低犯罪件数が続くビートは最も正確に予測されており（全体で79.3%の正確性）、中間件数のビートでは最も変動が大きかった。
降水量や積雪量が多い日には正確性がわずかに低下するが、その影響は小さく、データの希釈性や本質的な予測困難さに起因する可能性がある。
鉄道駅を含むビートは、周辺のビートと比較して平均1.2%高い正確性を示し、平日の予測は週末より0.9%高い正確性を示している。
モデルは平日の方が週末や休日よりも正確に機能しており、休日と比較して1.1%の正確性の優位性を示している。これは、都市活動のパターンがより一貫しているためと考えられる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。