[논문 리뷰] Equity in 311 Reporting: Understanding Socio-Spatial Differentials in the Propensity to Complain
이 연구는 뉴욕시에서 311 서비스 요청 행동의 사회공간적 격차를 분석하기 위해 건물 수준의 난방 및 뜨거운 물 위반 위험을 모델링하고 실제 신고량과 비교한다. 기울기 부스팅을 사용해 위반 가능성 예측하고, t-검정을 통해 부족 보고 및 과다 보고 지역 간 비교를 수행한 결과, 소득 수준이 높고, 백인, 영어 능력이 있는, 노인층이 실제 건물 상태와는 무관하게 과다 보고하는 경향을 보이며, 저소득, 少수민족, 영어 능력이 제한된 인구는 부족 보고하는 것으로 나타났다. 이는 311 데이터에 내재된 체계적 편향이 공정한 서비스 배분을 저해함을 시사한다.
Cities across the United States are implementing information communication technologies in an effort to improve government services. One such innovation in e-government is the creation of 311 systems, offering a centralized platform where citizens can request services, report non-emergency concerns, and obtain information about the city via hotline, mobile, or web-based applications. The NYC 311 service request system represents one of the most significant links between citizens and city government, accounting for more than 8,000,000 requests annually. These systems are generating massive amounts of data that, when properly managed, cleaned, and mined, can yield significant insights into the real-time condition of the city. Increasingly, these data are being used to develop predictive models of citizen concerns and problem conditions within the city. However, predictive models trained on these data can suffer from biases in the propensity to make a request that can vary based on socio-economic and demographic characteristics of an area, cultural differences that can affect citizens' willingness to interact with their government, and differential access to Internet connectivity. Using more than 20,000,000 311 requests - together with building violation data from the NYC Department of Buildings and the NYC Department of Housing Preservation and Development; property data from NYC Department of City Planning; and demographic and socioeconomic data from the U.S. Census American Community Survey - we develop a two-step methodology to evaluate the propensity to complain: (1) we predict, using a gradient boosting regression model, the likelihood of heating and hot water violations for a given building, and (2) we then compare the actual complaint volume for buildings with predicted violations to quantify discrepancies across the City.
연구 동기 및 목표
- 뉴욕시에서 311 비긴급 서비스 시스템 사용 경향에 대한 사회공간적 격차를 특정하고 정량화하는 것.
- 실제 건물 상태와는 무관하게 인구통계학적, 사회경제적, 언어적 특성이 신고 행동에 미치는 영향을 평가하는 것.
- 예측 모델링 및 도시 서비스 배분에 311 데이터를 사용할 때 대표성 편향의 위험을 평가하는 것.
- 부족 보고 지역을 특정함으로써 공정한 자원 배분 및 지역사회 참여 전략을 제안하는 것.
제안 방법
- 기울기 부스팅 회귀 모델을 사용해 재산, 주거 및 도시 인프라 데이터를 기반으로 건물 수준의 난방 및 뜨거운 물 위반 위험을 예측한다.
- 예측된 위반 위험을 가진 건물의 실제 311 신고량을 비교하여 부족 보고 및 과다 보고 패턴을 식별한다.
- 신고의 공간적 및 시간적 패턴을 분석하여 보고 행동의 일치하지 않는 핫스팟을 탐지한다.
- 부족 보고 및 과다 보고 지역 간 인구통계학적 및 사회경제적 특성을 비교하기 위해 t-검정을 실시한다.
- 뉴욕시 311, 빌딩국, 주거보존개발국, 도시계획국 및 미국인구조사국의 데이터를 통합 분석한다.
- 지표 검증은 예측된 위반과 실제 신고를 비교함으로써 근사적으로 수행되며, 직접적인 상태 측정의 한계를 인정한다.
실험 결과
연구 질문
- RQ1실제 건물 상태와는 무관하게, 인구통계학적 및 사회경제적 특성은 311을 통해 난방 및 뜨거운 물 문제를 보고할 경향에 어떤 관련이 있는가?
- RQ2뉴욕시 311 시스템에서의 부족 보고 및 과다 보고의 공간적 및 시간적 패턴은 어떠한가?
- RQ3소득, 언어 능력, 인종, 가구 구조가 다양한 지역에서 신고 행동에 어떤 영향을 미치는가?
- RQ4예측된 위반과 실제 신고 간 격차는 311 데이터의 체계적 편향을 어떻게 드러내는가?
- RQ5이 격차는 전자정부의 공정한 도시 서비스 제공 및 예측 모델링에 어떤 함의를 갖는가?
주요 결과
- 중위 임대료와 소득이 높은 지역은 예측된 것보다 신고율이 유의미하게 높아 과다 보고 행동을 보이고 있다.
- 부족 보고 집단은 과다 보고 집단에 비해 흑인, 히스패닉 등 소수민족 비율이 유의미하게 높다.
- 영어 능력이 제한된 것은 부족 보고와 강하게 연관되어 있으며, t-값 9.74는 통계적으로 유의미한 격차를 시사한다.
- 부족 보고 집단은 실업률이 높고, 미혼 주민 비율이 높아 시민 참여에 대한 구조적 장벽이 있음을 시사한다.
- 과다 보고 지역은 70세 이상 어르신, 여성, 학사학위 이상 소지자가 더 많아 이들 집단에서 시민 참여가 더 활발함을 나타낸다.
- 이 연구는 건물의 13.8%를 유형 2(부족 보고)로, 5.4%를 유형 3(과다 보고)로 식별하여 도시 전역에서 보고의 형평성 문제 규모를 드러냈다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.