Skip to main content
QUICK REVIEW

[논문 리뷰] The Unpaid Toll: Quantifying and Addressing the Public Health Impact of Data Centers

Yu Han, Zhifeng Wu|arXiv (Cornell University)|2024. 12. 09.
Health, Environment, Cognitive Aging인용 수 8
한 줄 요약

본 논문은 세 가지 배출 범위에 걸쳐 AI 데이터 센터의 공중보건 부담을 모델링하고 정량화하며, 분산 모델링을 사용해 건강 영향과 비용을 추정하고, 건강 정보를 반영한 AI 관행 및 보고 프로토콜을 권고한다.

ABSTRACT

The surging demand for AI has led to a rapid expansion of energy-intensive data centers, impacting the environment through escalating carbon emissions and water consumption. While significant attention has been paid to data centers' growing environmental footprint, the public health burden, a hidden toll of data centers, has been largely overlooked. Specifically, data centers' lifecycle, from chip manufacturing to operation, can significantly degrade air quality through emissions of criteria air pollutants such as fine particulate matter, substantially impacting public health. This paper introduces a principled methodology to model lifecycle pollutant emissions for data centers and computing tasks, quantifying the public health impacts. Our findings reveal that training a large AI model comparable to the Llama-3.1 scale can produce air pollutants equivalent to more than 10,000 round trips by car between Los Angeles and New York City. The growing demand for AI is projected to push the total annual public health burden of U.S. data centers up to more than $20 billion in 2028, rivaling that of on-road emissions of California. Further, the public health costs are more felt in disadvantaged communities, where the per-household health burden could be 200x more than that in less-impacted communities. Finally, we propose a health-informed computing framework that explicitly incorporates public health risk as a key metric for scheduling data center workloads across space and time, which can effectively mitigate adverse health impacts while advancing environmental sustainability. More broadly, we also recommend adopting a standard reporting protocol for the public health impacts of data centers and paying attention to all impacted communities.

연구 동기 및 목표

  • 환경 지표와 함께 AI 데이터 센터의 공중보건 영향 고려의 필요성을 제고한다.
  • 세 가지 범위(1, 2, 3)에 걸친 AI 관련 대기 오염 물질을 정량화하고 건강 영향 및 비용에 매핑하는 일반 방법론을 개발한다.
  • 지역 건강 영향을 추정하기 위해 분산 모형화를 적용하고 미국 데이터 센터 및 Llama-3.1 학습 규모에 초점을 맞춘다.
  • 건강 비용 보고 및 건강 정보를 반영한 AI 관행을 채택하기 위한 정책 및 산업 권고를 제공한다.

제안 방법

  • 태스크에 대한 비례 귀속과 함께 scope-1, scope-2, scope-3 AI 대기 오염 물질 배출을 정의합니다(Equations 1–3).
  • 일반 분산 모델 D_theta와 COBRA/PCAPS와 같은 도구를 사용해 오염 물질 분산을 모델링하고 수용체 농도를 추정합니다.
  • 역학 기반 관계 및 비용 매핑을 통해 오염 농도를 건강 결과 및 경제적 비용으로 변환합니다.
  • 건강 영향 평가를 위해 COBRA (Desktop v5.1)를 사용하고 기본 배출량을 선형, 지수 및 변화 없음 방식으로 외삽합니다.
  • 센터 성장에 대한 EPRI 및 McKinsey의 전력 수요 시나리오를 사용하여 미국 인접 주 및 워싱턴 D.C.에 분석을 집중합니다.

실험 결과

연구 질문

  • RQ1현재 및 예측 성장 시나리오에서 미국의 AI 데이터 센터 배출과 관련된 공중보건 부담(건강 결과 및 비용)은 얼마나 정량화되는가?
  • RQ2Scope 1(백업 발전기), Scope 2(그리드 전력), Scope 3(하드웨어/제조) 배출이 지역 대기질 및 건강 비용에 어떻게 기여하는가?
  • RQ3건강 영향은 지역에 따라 어떻게 달라지며, 불평등한 건강 부담을 완화할 수 있는 정책이나 보고 관행은 무엇인가?

주요 결과

  • 미국 데이터 센터는 2030년(스코프-2 중심) 약 60만 건의 천식 증상 사례와 1,300명의 조기 사망을 초래할 수 있다.
  • 미국 데이터 센터의 공중보건 비용은 연간 200억 달러를 초과할 수 있으며, 캘리포니아의 도로 배출에 필적하고 미국 석탄 기반 제철 생산의 두 배에 달한다.
  • Llama-3.1 규모의 AI 모델 학습은 10,000대 LA–NYC 자동차 이동분에 해당하는 오염 물질을 배출할 수 있으며, 건강 비용은 학습 전력 비용의 120%를 초과한다.
  • 버지니아 지역의 Scope-1(백업 발전기)은 허가 배출의 10%에서도 연간 2억 2천만 달러에서 3억 달러의 공중보건 비용이 들 수 있으며, 최대 허가 수준에서는 22억~30억 달러의 비용이 발생할 수 있다.
  • Scope-3(반도체 제조)는 시설당 연간 2,600만~3,900만 달러의 비용을 기여할 수 있으며, 오하이오로의 이전은 비용을 9,400만~15,600만 달러로 증가시킬 수 있다.
  • 건강 부담은 고르게 분포되지 않으며, 혜택이 부족한 카운티에서 가구당 부담이 최대 200배까지 증가할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.