[論文レビュー] The Unpaid Toll: Quantifying and Addressing the Public Health Impact of Data Centers
この論文は、拡散モデルを用いて健康影響とコストを推定し、3つの排出スコープにわたるAIデータセンターの公衆衛生負担をモデル化・定量化し、健康を考慮したAI実践と報告プロトコルを提案する。
The surging demand for AI has led to a rapid expansion of energy-intensive data centers, impacting the environment through escalating carbon emissions and water consumption. While significant attention has been paid to data centers' growing environmental footprint, the public health burden, a hidden toll of data centers, has been largely overlooked. Specifically, data centers' lifecycle, from chip manufacturing to operation, can significantly degrade air quality through emissions of criteria air pollutants such as fine particulate matter, substantially impacting public health. This paper introduces a principled methodology to model lifecycle pollutant emissions for data centers and computing tasks, quantifying the public health impacts. Our findings reveal that training a large AI model comparable to the Llama-3.1 scale can produce air pollutants equivalent to more than 10,000 round trips by car between Los Angeles and New York City. The growing demand for AI is projected to push the total annual public health burden of U.S. data centers up to more than $20 billion in 2028, rivaling that of on-road emissions of California. Further, the public health costs are more felt in disadvantaged communities, where the per-household health burden could be 200x more than that in less-impacted communities. Finally, we propose a health-informed computing framework that explicitly incorporates public health risk as a key metric for scheduling data center workloads across space and time, which can effectively mitigate adverse health impacts while advancing environmental sustainability. More broadly, we also recommend adopting a standard reporting protocol for the public health impacts of data centers and paying attention to all impacted communities.
研究の動機と目的
- 環境指標と併せてAIデータセンターの公衆衛生影響を考慮する必要性を喚起する。
- 3つのスコープ(1, 2, 3)にわたるAI関連空気汚染物質を定量化し、それを健康アウトカムとコストに対応づける汎用的な方法論を開発する。
- 拡散モデルを適用して地域的な健康影響とコストを推定し、米国のデータセンターとLlama-3.1規模の訓練に焦点を当てる。
- 健康コストを報告し、健康を考慮したAI実践を採用するための政策および産業レベルの提言を提供する。
提案手法
- タスクへの割合寄与を用いて、scope-1、scope-2、およびscope-3のAI空気汚染物質排出を定義する(式1–3)。
- 一般拡散モデル D_theta を用いて汚染物質の拡散をモデル化し、COBRA/PCAPS などのツールを用いて受容体濃度を推定する。
- 疫学に基づく関係とコスト mappings を用いて汚染物質濃度を健康アウトカムと経済的コストに換算する。
- 健康影響評価のために COBRA (Desktop v5.1) を用い、ベースライン排出を線形・指数・未変更の方法で外挿する。
- 分析は米国本土46州とワシントンD.C.を対象とし、センターの成長にはEPRIおよびMcKinseyの電力需要シナリオを用いる。
実験結果
リサーチクエスチョン
- RQ1現在および予測成長シナリオ下で、AIデータセンター排出による米国の公衆衛生負担(健康アウトカムとコスト)はどの程度定量化されるか?
- RQ2Scope 1(バックアップ発電機)、Scope 2(グリッド電力)、Scope 3(ハードウェア/製造)からの排出は、地域の大気質と健康コストにどのように寄与するか?
- RQ3場所によって健康影響はどのように異なるか、そして不公平な健康負担を軽減するためにどのような政策や報告慣行が有効か?
主な発見
- 米国のデータセンターは2030年に約60万のぜんそく症状の発生と1,300人の早期死亡を引き起こす可能性がある(scope-2 に焦点)。
- 米国全体のデータセンター公衆衛生コストは年間200億ドルを超える可能性があり、カリフォルニア州のオンロード排出と並ぶ水準、米国の石炭ベース鉄鋼製造の約2倍に相当。
- Llama-3.1規模でAIモデルを訓練すると、LA–NYCの車の走行約1万回以上に相当する汚染物質を排出し、健康コストは訓練電力コストの120%以上になる。
- バージニア州地域のScope-1(バックアップ発電機)は年間2.2–3.0億ドルの公衆衛生コストを招く可能性がある(許容排出量の10%でも)、最大許容水準では22–30億ドルになる可能性。
- Scope-3(半導体製造)は施設あたり年間2600万〜3900万ドルの寄与があり、オハイオ州への移転でコストが9400万〜1億5600万ドルに上昇する可能性。
- 健康負担は不均等に分布しており、恵まれない郡では1戸あたり負担が200倍程度になる可能性がある。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。