[论文解读] Hybrid Neuro-Evolutionary Method for Predicting Wind Turbine Power Output
本文提出一种混合神经进化模型 SaDE-LSTM,结合自适应差分进化(SaDE)进行超参数优化与长短期记忆(LSTM)循环神经网络,以提升短期风力涡轮机功率预测的准确性。该方法通过 k-means 聚类与自编码器对噪声 SCADA 数据进行过滤,显著提升预测性能,在 10 分钟与 1 小时预测时延下均达到最先进水平,RMSE 值最低达 1.431×10⁻³,R² 分数超过 0.991。
Reliable wind turbine power prediction is imperative to the planning, scheduling and control of wind energy farms for stable power production. In recent years Machine Learning (ML) methods have been successfully applied in a wide range of domains, including renewable energy. However, due to the challenging nature of power prediction in wind farms, current models are far short of the accuracy required by industry. In this paper, we deploy a composite ML approach--namely a hybrid neuro-evolutionary algorithm--for accurate forecasting of the power output in wind-turbine farms. We use historical data in the supervisory control and data acquisition (SCADA) systems as input to estimate the power output from an onshore wind farm in Sweden. At the beginning stage, the k-means clustering method and an Autoencoder are employed, respectively, to detect and filter noise in the SCADA measurements. Next, with the prior knowledge that the underlying wind patterns are highly non-linear and diverse, we combine a self-adaptive differential evolution (SaDE) algorithm as a hyper-parameter optimizer, and a recurrent neural network (RNN) called Long Short-term memory (LSTM) to model the power curve of a wind turbine in a farm. Two short time forecasting horizons, including ten-minutes ahead and one-hour ahead, are considered in our experiments. We show that our approach outperforms its counterparts.
研究动机与目标
- 提升短期风力涡轮机功率预测的准确性,以促进电网并网与风电场管理。
- 应对来自 SCADA 系统的非线性、噪声大且混沌的风力发电时间序列数据带来的挑战。
- 开发一种鲁棒的混合模型,结合数据预处理、先进优化与深度学习技术,以提升预测性能。
- 评估不同输入特征(风速、风向、当前功率)对预测性能的影响。
提出的方法
- 采用 k-means 聚类与自编码器检测并过滤原始 SCADA 数据中的噪声。
- 使用长短期记忆(LSTM)循环神经网络建模风力涡轮机的非线性功率曲线。
- 应用自适应差分进化(SaDE)优化 LSTM 超参数,包括学习率、层数与神经元数量。
- 对比多种优化技术:网格搜索、灰狼优化器(GWO)、差分进化(DE)与 CMA-ES。
- 评估四种不同输入组合的预测模型:仅风速、风速与风向、风速与功率、以及三者全部输入。
- 在为期 42 个月的陆上风电场数据集上开展实验,覆盖 10 分钟与 1 小时预测时延。
实验结果
研究问题
- RQ1所提出的 SaDE-LSTM 模型在风力涡轮机功率输出预测方面相较于其他混合模型表现如何?
- RQ2采用 k-means 与自编码器进行数据预处理对预测准确性有何影响?
- RQ3风速、风向与当前功率的何种输入特征组合能获得最佳预测性能?
- RQ4自适应差分进化(SaDE)在优化 LSTM 超参数以用于风力发电预测方面效果如何?
- RQ5使用清洁数据是否能显著提升深度学习模型在风力发电预测中的性能?
主要发现
- SaDE-LSTM 模型在 10 分钟预测时延下取得最低 RMSE 值 1.431×10⁻³,在 1 小时时延下为 2.833×10⁻²,优于所有基线模型。
- 该模型在 10 分钟时延下 R² 得分为 0.9921,在 1 小时时延下为 0.9931,表明具有极高的预测准确性。
- 经过 k-means 与自编码器过滤后的清洁数据显著提升了模型性能,相较于原始数据表现更优。
- 包含全部三项输入(风速、风向与当前功率)的模型表现最佳,优于输入更少的模型。
- Friedman 检验确认结果具有统计显著性,SaDE-LSTM 在所有配置中均取得最佳平均排名。
- 结合 SaDE 与 LSTM 的混合方法在不同超参数设置下展现出更优的鲁棒性与泛化能力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。