[論文レビュー] Predictive Enforcement
本論文は、執行決定が犯罪データの収集に影響を与える動的でデータ情報に基づく執行モデルを開発し、外生的および内生的な犯罪と変化する世界のバンディット枠組みの下で最適予測執行を分析する。
We study law enforcement guided by data-informed predictions of "hot spots" for likely criminal offenses. Such "predictive" enforcement could lead to data being selectively and disproportionately collected from neighborhoods targeted for enforcement by the prediction. Predictive enforcement that fails to account for this endogenous "datafication" may lead to the over-policing of traditionally high-crime neighborhoods and performs poorly, in particular, in some cases as poorly as if no data were used. Endogenizing the incentives for criminal offenses identifies additional deterrence benefits from the informationally efficient use of data.
研究の動機と目的
- データ情報に基づく予測が警察活動における執行とデータ収集にどのように影響するかを動機づけ、形式化する。
- 執行とデータ化をモデル化するため、変化する世界をもつ連続時間バンディット系を開発する。
- 最適予測執行方針(OP)を導出し、それを非予測(NP)および貪欲予測(GP)のベンチマークと比較する。
- 犯罪インセンティブを内生化して、執行が犯罪行動とデータ収集にどのように影響するかを研究する。
- 予測執行が福祉を改善する場合と、データフィードバックループによって低下する場合を特徴づける。
提案手法
- 状態が高い(H)のとき、レートlambdaのポアソン過程として到着する犯罪を防ぐため、単位あたりのコストcで介入 y_t ∈ [0,1] を選択する政策立案者PMをモデル化する。
- 状態ダイナミクスは、切替率 rho_L および rho_H を持つ連続時間マルコフ連鎖と定常確率 pi_0に従う。
- 予測はBayesの法則により、状態がHであるというPMの信念p_tを更新し、自然状態遷移と検知からの学習を含む微分方程式 dot{p}=f(p,y) によって信念ダイナミクスを定義する。
- 3つの執行 regimeを定式化する:非予測(NP)、貪欲予測(GP)、最適予測(OP)。それぞれ異なる意思決定規則 y(p) を持つ。
- OPの下で価値関数に対するHJB方程式を導く動的計画法の問題を解き、カットオフ政策 y(p)=1 ただし p>hat{p}、そうでなければ0 を得る。
- OPのカットオフ hat{p} は x lambda および c に依存して3つのケースに分かれ、ケース1(低犯罪率)では hat{p} > pi_0、ケース2(高犯罪率)では hat{p}=hat{p}_M かつ hat{p}≤pi_1、ケース3(中間)では hat{p} ∈ (pi_1, pi_0) かつ hat{p}<hat{p}_M。
実験結果
リサーチクエスチョン
- RQ1執行によって駆動されるデータ化(内生的データ収集)は、予測執行の福祉と有効性にどう影響するか?
- RQ2外生的犯罪下で、予測執行(OP)は非予測(NP)や貪欲予測(GP)方針よりいつ有利になるか?
- RQ3時間とともに変化する世界の動力学(時間とともに進化する状態)は、学習の価値と最適執行の構造をどう変えるか?
- RQ4犯罪インセンティブが執行に反応して内生化され、データが犯罪者に観測可能な場合、執行と犯罪はどうなるか?
- RQ5予測政策がフィードバックループにより失敗するのはどのような場合で、優れた抑止力を発揮するのはどのような場合か?
主な発見
- 外生的犯罪の下では、長期にわたって外部学習がない限りGPはNPを上回らない;OPは中程度のコストでより多く探索することでGPを上回り得る。
- 最適カットオフ hat{p} は x lambda および c に依存して3つのケースに分かれ、ケース1(低犯罪率)では hat{p} > pi_0、ケース2(高犯罪率)では hat{p}=hat{p}_M かつ hat{p}≤pi_1、ケース3(中間)では hat{p} ∈ (pi_1, pi_0) かつ hat{p}<hat{p}_M。
- 犯罪インセンティブを内生化する(犯罪者の予想執行に対する反応)と、OPは情報価値と戦略的反応を考慮するため、GPより強い抑止力を生む。
- 十分小さなcの場合、GPとOPは政策として一致するが、内生的なインセンティブがある際には平衡での犯罪は依然としてOPの方が低くなる。
- 予測優位性が失われると(例:犯罪者がデータにアクセスする)、3つの regime は共通の結果に収束し、予測の条件付き価値を浮き彫りにする。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。