Skip to main content
QUICK REVIEW

[论文解读] Carbontracker: Tracking and Predicting the Carbon Footprint of Training Deep Learning Models

Lasse F. Wolff Anthony, Benjamin Kanding|arXiv (Cornell University)|Jul 6, 2020
Advanced Neural Network Applications参考文献 22被引用 203
一句话总结

Carbontracker 是一个开源的 Python 工具,用于在深度学习模型训练过程中跟踪并预测能源使用与碳排放,并且在预测的足迹超过阈值时可以警告用户停止训练。

ABSTRACT

Deep learning (DL) can achieve impressive results across a wide variety of tasks, but this often comes at the cost of training models for extensive periods on specialized hardware accelerators. This energy-intensive workload has seen immense growth in recent years. Machine learning (ML) may become a significant contributor to climate change if this exponential trend continues. If practitioners are aware of their energy and carbon footprint, then they may actively take steps to reduce it whenever possible. In this work, we present Carbontracker, a tool for tracking and predicting the energy and carbon footprint of training DL models. We propose that energy and carbon footprint of model development and training is reported alongside performance metrics using tools like Carbontracker. We hope this will promote responsible computing in ML and encourage research into energy-efficient deep neural networks.

研究动机与目标

  • 在 ML 研究与实践中推动在性能指标之外报告能源与碳足迹。
  • 提供一个实用工具,用于监测、预测并在必要时干预以减少 DL 模型训练的环境影响。
  • 在医学影像数据集的 CNN 上演示该工具,并评估预测准确性。
  • 突出影响碳足迹的因素,包括区域碳强度与硬件组成,以引导减排策略。

提出的方法

  • 开发一个基于 Python 的多线程工具,实时测量 GPU、CPU 与 DRAM 的功耗。
  • 使用一个简单的线性模型在用户指定的训练轮数上预测总培训能耗与碳足迹。
  • 通过实时 API 预测所述持续时间的碳强度,以计算 CO2eq 排放。
  • 通过允许在预测的足迹超过阈值时停止训练来实现干预。
  • 支持跨平台部署(集群、桌面、Colab),并可无缝集成到现有代码库中。

实验结果

研究问题

  • RQ1在部分监控数据的情况下,Carbontracker 能多准确地预测 DL 模型训练的能源与碳足迹?
  • RQ2在训练过程中,GPU、CPU 与 DRAM 的能源使用分布是怎样的?
  • RQ3区域碳强度和预测准确性如何影响 CO2eq 的估算及建议的减排措施?

主要发现

  • 在监控仅 1 个 epoch 后,能源预测误差在 4.9% 到 19.1% 之间。
  • 同一设置下,CO2eq 预测误差在 7.3% 到 19.9% 之间。
  • 训练时长预测在各实验中的误差为 0.8% 至 4.6%。
  • GPU 大约占总能耗的 50%–60%,CPU 与 DRAM 也占据了相当比例。
  • 实时或预测的碳强度显著改进了与区域平均值相比的 CO2eq 估算。
  • 论文展示了在不同区域(如爱沙尼亚与瑞典)和一天中的不同时间可能出现的排放差异,提示训练时机与地点可作为减排杠杆。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。