[论文解读] Making AI Less "Thirsty": Uncovering and Addressing the Secret Water Footprint of AI Models
本文提出一种有原则的方法论,用于估计 AI 模型的总水足迹,包括运营水(scope-1/2)与体现水,并展示水效率在空间和时间上的变异,以为调度策略提供信息。它倡导透明性和对水和碳足迹的整体考量,以实现可持续AI。
The growing carbon footprint of artificial intelligence (AI) has been undergoing public scrutiny. Nonetheless, the equally important water (withdrawal and consumption) footprint of AI has largely remained under the radar. For example, training the GPT-3 language model in Microsoft's state-of-the-art U.S. data centers can directly evaporate 700,000 liters of clean freshwater, but such information has been kept a secret. More critically, the global AI demand is projected to account for 4.2-6.6 billion cubic meters of water withdrawal in 2027, which is more than the total annual water withdrawal of 4-6 Denmark or half of the United Kingdom. This is concerning, as freshwater scarcity has become one of the most pressing challenges. To respond to the global water challenges, AI can, and also must, take social responsibility and lead by example by addressing its own water footprint. In this paper, we provide a principled methodology to estimate the water footprint of AI, and also discuss the unique spatial-temporal diversities of AI's runtime water efficiency. Finally, we highlight the necessity of holistically addressing water footprint along with carbon footprint to enable truly sustainable AI.
研究动机与目标
- 在淡水资源稀缺的背景下,激发研究 AI 模型隐藏水足迹的必要性。
- 建立一个有原则的方法论,估算 AI 模型的运营水和体现水。
- 展示一个案例研究,估算 GPT-3 的运营水消耗以说明该方法。
- 突出水效率的时空变异及其对调度 AI 工作负载的影响。
- 倡导透明性和整体可持续性,将水足迹与碳足迹结合起来。
提出的方法
- 界定并区分水抽取与水消耗(WWF 与 WCF)
- 使用现场水利用效率 (WUE)(scope-1)与离场水利用效率(WUE,scope-2)结合时变因素来建模运营水足迹。
- 纳入数据中心 PUE,将 IT 能源使用量与总用水量联系起来。
- 将制造水摊销到服务器生命周期以计算体现水足迹。
- 结合运营和体现组成部分,得到总水足迹(WaterTotal)。
- 应用该框架到 GPT-3 案例研究,利用特定地点的 PUE/WUE 和电力水强度数据。
实验结果
研究问题
- RQ1我们如何量化 AI 模型的总水足迹(运营水加体现水)?
- RQ2现场和离场用水效率如何随时间和地点变化,它如何影响 AI 水足迹?
- RQ3水足迹变异性对调度训练与推理工作负载的影响是什么?
- RQ4需要哪些透明性措施来向开发者和用户传达 AI 的水足迹?
- RQ5在可持续 AI 中,水足迹考量应如何与碳足迹目标平衡?
主要发现
- GPT-3 的运营水足迹可能相当可观,并随地点和冷却配置而变化(例如现场与离场用水的影响)。
- 水效率在空间和时间上都具有多样性,影响训练和推理的最佳时机和地点以降低水足迹。
- 全面视角显示出降低水足迹与碳足迹之间的潜在冲突,需制定平衡的策略。
- 制造中的体现水贡献总足迹,并在模型整个生命周期中按服务器寿命摊销。
- 模型卡中存在透明度缺口;作者倡导包括 scope-1 和 scope-2 的水使用信息,以提高理解和管理。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。