[论文解读] SDWPF: A Dataset for Spatial Dynamic Wind Power Forecasting Challenge at KDD Cup 2022
本文为在半年的时间里对134座风机的空间动态风力发电预测,包含空间位置和动态上下文,并提出基线GRU解决方案以应对百度KDD杯2022挑战。
The variability of wind power supply can present substantial challenges to incorporating wind power into a grid system. Thus, Wind Power Forecasting (WPF) has been widely recognized as one of the most critical issues in wind power integration and operation. There has been an explosion of studies on wind power forecasting problems in the past decades. Nevertheless, how to well handle the WPF problem is still challenging, since high prediction accuracy is always demanded to ensure grid stability and security of supply. We present a unique Spatial Dynamic Wind Power Forecasting dataset: SDWPF, which includes the spatial distribution of wind turbines, as well as the dynamic context factors. Whereas, most of the existing datasets have only a small number of wind turbines without knowing the locations and context information of wind turbines at a fine-grained time scale. By contrast, SDWPF provides the wind power data of 134 wind turbines from a wind farm over half a year with their relative positions and internal statuses. We use this dataset to launch the Baidu KDD Cup 2022 to examine the limit of current WPF solutions. The dataset is released at https://aistudio.baidu.com/aistudio/competition/detail/152/0/datasets.
研究动机与目标
- 引入具有动态上下文的分布式风力发电数据集用于风力功率预测(WPF)研究。
- 使能够在风电场尺度上评估具有空间相关性的风力发电预测方法。
- 突出数据集特征、评估协议以及超越传统时间序列WPF数据集的挑战。
- 为KDD Cup 2022竞赛提供基线模型和可重复的评估设置。
提出的方法
- 数据集来自一个134座风机的SCADA系统,采样间隔为10分钟。
- 包含外部特征(风速、风向、温度)和内部风机状态(机舱温度、桨距角等)。
- 提供风机级数据以及空间坐标以建模机组间的空间相关性。
- 定义一个48小时前的预测任务,产生288步的时间步长,时间间隔为10分钟。
- 评估框架将RMSE和MAE按风机聚合,并使用特定的评分公式。
- 提供使用门控循环单元(GRU)的基线代码,面向 PaddleSpatial 发布。
实验结果
研究问题
- RQ1采用SDWPF数据的时空模型在48小时预测中能达到多高的准确性?
- RQ2与传统时间序列方法相比,纳入空间位置信息和动态上下文对预测准确性的影响如何?
- RQ3在风力发电预测和评估中,缺失、未知和异常的SCADA值应如何处理?
- RQ4百度KDD Cup 2022任务的基线性能如何,简单模型与更先进方法的比较如何?
主要发现
- SDWPF包含约半年的134座风机数据,采样为10分钟,并包括空间位置和内部风机状态。
- 挑战要求对该风场进行48小时前的风力发电预测,输出每10分钟一次,评估指标为RMSE和MAE。
- 提供一个基线GRU模型,在195个预测上实现RMSE 47.081286、MAE 37.558233,以及总分42.319760。
- 评估框架将各风机的得分相加以形成跨风机的最终模型分数。
- 代码和评估设置已公开发布,以实现可重复性和基准评估。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。