[論文レビュー] Equity in 311 Reporting: Understanding Socio-Spatial Differentials in the Propensity to Complain
本研究は、ニューヨーク市における311サービス要請行動の社会的・空間的格差を、建物単位の暖房およびお湯供給違反リスクをモデル化し、実際の苦情件数と比較することで調査する。勾配ブースティングを用いて違反発生の可能性を予測し、t検定を用いて低苦情地域と高苦情地域を比較することで、収入水準、人種、英語能力、年齢などの要因による苦情行動の格差を明らかにした。その結果、高所得・白人・英語能力者・高齢者層は過剰に苦情を申し入れている一方、低所得・マイノリティ・英語能力が制限された人々は不足して苦情を申し入れていることが判明。これは311データに内在する制度的バイアスを示しており、公平なサービス配分を損なう要因となっている。
Cities across the United States are implementing information communication technologies in an effort to improve government services. One such innovation in e-government is the creation of 311 systems, offering a centralized platform where citizens can request services, report non-emergency concerns, and obtain information about the city via hotline, mobile, or web-based applications. The NYC 311 service request system represents one of the most significant links between citizens and city government, accounting for more than 8,000,000 requests annually. These systems are generating massive amounts of data that, when properly managed, cleaned, and mined, can yield significant insights into the real-time condition of the city. Increasingly, these data are being used to develop predictive models of citizen concerns and problem conditions within the city. However, predictive models trained on these data can suffer from biases in the propensity to make a request that can vary based on socio-economic and demographic characteristics of an area, cultural differences that can affect citizens' willingness to interact with their government, and differential access to Internet connectivity. Using more than 20,000,000 311 requests - together with building violation data from the NYC Department of Buildings and the NYC Department of Housing Preservation and Development; property data from NYC Department of City Planning; and demographic and socioeconomic data from the U.S. Census American Community Survey - we develop a two-step methodology to evaluate the propensity to complain: (1) we predict, using a gradient boosting regression model, the likelihood of heating and hot water violations for a given building, and (2) we then compare the actual complaint volume for buildings with predicted violations to quantify discrepancies across the City.
研究の動機と目的
- ニューヨーク市における311非緊急サービスシステムの利用傾向にみられる社会的・空間的格差を特定・定量化すること。
- 実際の建物状態とは独立して、人種的・社会経済的・言語的特性が苦情行動に与える影響を評価すること。
- 予測モデリングや都市サービス配分に用いられる311データにおける代表性バイアスのリスクを評価すること。
- 申告不足のコミュニティを特定することで、公平なリソース配分およびコミュニティ参加戦略の立案を支援すること。
提案手法
- 勾配ブースティング回帰モデルを用いて、不動産、住宅、都市インfraデータを活用し、建物単位の暖房およびお湯供給違反の発生可能性を予測する。
- 予測違反リスクが見込まれる建物の実際の311苦情件数を比較し、申告不足・過剰申告のパターンを同定する。
- 苦情の空間的・時間的パターンを分析し、報告行動の不一致が顕著なホットスポットを特定する。
- t検定を用いて、申告不足地域と過剰申告地域の間で人種的・社会経済的特性を比較する。
- ニューヨーク市311、都市建設局、住宅保全局、都市計画局、アメリカ国勢調査のデータを統合して分析する。
- 地面検証の代替として、予測違反と実際の苦情を比較することで妥当性を推定するが、直接的な状態測定の限界を認識する。
実験結果
リサーチクエスチョン
- RQ1実際の建物状態とは独立して、人種的・社会経済的特性は311を通じた暖房・お湯供給問題の申告傾向にどのように関連しているか?
- RQ2ニューヨーク市311システムにおける申告不足・過剰申告の空間的・時間的パターンは何か?
- RQ3収入、言語能力、人種、世帯構成が、異なる地域における苦情行動にどの程度影響を及えるか?
- RQ4予測違反と実際の苦情の乖離が、311データにおける制度的バイアスをどのように露呈するか?
- RQ5これらの格差は、e政府における公平な都市サービス配分および予測モデリングにどのような意味を持つのか?
主な発見
- 中位家賃・収入が高い地域では、予測を上回る著しい苦情件数が観察され、過剰申告の傾向が示された。
- 申告不足グループは、白人でない・ヒスパニック系住民の割合が、過剰申告グループに比べて顕著に高いことが判明した。
- 英語能力が制限された人々は、申告不足と強く関連しており、t値9.74という統計的に有意な乖離を示した。
- 申告不足グループは、失業率が高く、未婚世帯の割合も高いことから、市民参加に向けた構造的障壁が存在することが示唆された。
- 過剰申告コミュニティでは、70歳以上の人々、女性、学士号保有者がより高い割合を占めており、これらのグループの市民参加意欲の高さが裏付けられた。
- 本研究では、建物の13.8%がタイプ2(申告不足)に、5.4%がタイプ3(過剰申告)に分類され、都市全体における申告格差の規模が浮き彫りになった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。