[论文解读] Equity in 311 Reporting: Understanding Socio-Spatial Differentials in the Propensity to Complain
本研究通过建模建筑层面的供暖与热水违规风险,并将其与实际投诉量进行比较,调查了纽约市311服务请求行为中的社会空间差异。利用梯度提升算法预测违规可能性,并通过t检验比较低投诉与高投诉社区的差异,研究发现投诉倾向存在显著的人口与社会经济差异:高收入、白人、英语流利及老年人群存在过度投诉,而低收入、少数族裔及英语能力有限的人群则存在投诉不足——凸显了311数据中系统性偏差的存在,这会削弱公共服务的公平分配。
Cities across the United States are implementing information communication technologies in an effort to improve government services. One such innovation in e-government is the creation of 311 systems, offering a centralized platform where citizens can request services, report non-emergency concerns, and obtain information about the city via hotline, mobile, or web-based applications. The NYC 311 service request system represents one of the most significant links between citizens and city government, accounting for more than 8,000,000 requests annually. These systems are generating massive amounts of data that, when properly managed, cleaned, and mined, can yield significant insights into the real-time condition of the city. Increasingly, these data are being used to develop predictive models of citizen concerns and problem conditions within the city. However, predictive models trained on these data can suffer from biases in the propensity to make a request that can vary based on socio-economic and demographic characteristics of an area, cultural differences that can affect citizens' willingness to interact with their government, and differential access to Internet connectivity. Using more than 20,000,000 311 requests - together with building violation data from the NYC Department of Buildings and the NYC Department of Housing Preservation and Development; property data from NYC Department of City Planning; and demographic and socioeconomic data from the U.S. Census American Community Survey - we develop a two-step methodology to evaluate the propensity to complain: (1) we predict, using a gradient boosting regression model, the likelihood of heating and hot water violations for a given building, and (2) we then compare the actual complaint volume for buildings with predicted violations to quantify discrepancies across the City.
研究动机与目标
- 识别并量化纽约市居民使用311非紧急服务系统的社会空间差异。
- 评估人口、社会经济及语言特征如何在独立于实际建筑条件的情况下影响投诉行为。
- 评估在用于预测建模与城市服务分配时,311数据中代表性偏差的风险。
- 通过识别投诉不足的社区,为公平的资源分配与社区参与策略提供建议。
提出的方法
- 使用属性、住房及城市基础设施数据,通过梯度提升回归模型在建筑层面预测供暖与热水违规的可能性。
- 将预测存在违规的建筑的实际311投诉量与预测的违规可能性进行比较,以识别投诉不足与过度投诉的模式。
- 分析投诉的空间与时间模式,以检测报告行为不一致的热点区域。
- 通过t检验比较投诉不足与过度投诉社区的人口与社会经济特征。
- 分析整合了纽约市311、房屋局、住房保护与发展局、城市规划局及美国社区调查的数据。
- 通过将预测违规与实际投诉进行比较,对真实情况提供近似验证,同时承认直接测量建筑状况的局限性。
实验结果
研究问题
- RQ1在独立于实际建筑条件的情况下,人口与社会经济特征如何与通过311报告供暖与热水问题的倾向相关联?
- RQ2纽约市311系统中投诉不足与过度投诉的空间与时间模式是什么?
- RQ3收入、语言能力、种族及家庭结构在不同社区中在多大程度上影响投诉行为?
- RQ4预测违规与实际投诉之间的差异如何揭示311数据中的系统性偏差?
- RQ5这些差异对公平的城市服务交付及电子政府中的预测建模有何影响?
主要发现
- 中位租金与收入较高的社区,其投诉率显著高于预测值,表明存在过度投诉行为。
- 投诉不足群体中,少数族裔人口比例显著更高,包括非白人及西班牙裔人口,相较于过度投诉群体。
- 英语能力有限与投诉不足密切相关,t值为9.74,表明存在统计学上显著的差异。
- 投诉不足群体的失业率更高,且未婚居民比例更高,表明存在阻碍公民参与的结构性障碍。
- 过度投诉社区中,70岁以上老年人、女性及至少拥有学士学位的居民比例更高,表明这些群体的公民参与度更高。
- 本研究识别出13.8%的建筑为类型2(投诉不足),5.4%为类型3(过度投诉),凸显了全市范围内报告不公的规模。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。