Skip to main content
QUICK REVIEW

[论文解读] Random Vector Functional Link Neural Network based Ensemble Deep Learning

Rakesh Katuwal, Ponnuthurai Nagaratnam Suganthan|arXiv (Cornell University)|Jun 30, 2019
Machine Learning and ELM参考文献 40被引用 25
一句话总结

本文提出了一种深度随机向量函数链接(dRVFL)神经网络及其集成变体(edRVFL),通过使用随机生成且固定的隐藏层权重,并采用闭式解计算输出权重,实现了高效的学习。通过堆叠多层随机化网络,并在单次训练中集成集成学习,该框架在多种基准数据集上实现了优越的泛化能力和效率,其准确率和鲁棒性均优于浅层RVFL和传统深度学习模型。

ABSTRACT

In this paper, we propose a deep learning framework based on randomized neural network. In particular, inspired by the principles of Random Vector Functional Link (RVFL) network, we present a deep RVFL network (dRVFL) with stacked layers. The parameters of the hidden layers of the dRVFL are randomly generated within a suitable range and kept fixed while the output weights are computed using the closed form solution as in a standard RVFL network. We also propose an ensemble deep network (edRVFL) that can be regarded as a marriage of ensemble learning with deep learning. Unlike traditional ensembling approaches that require training several models independently from scratch, edRVFL is obtained by training a single dRVFL network once. Both dRVFL and edRVFL frameworks are generic and can be used with any RVFL variant. To illustrate this, we integrate the deep learning networks with a recently proposed sparse-pretrained RVFL (SP-RVFL). Extensive experiments on benchmark datasets from diverse domains show the superior performance of our proposed deep RVFL networks.

研究动机与目标

  • 为解决传统基于反向传播的深度神经网络存在的高训练成本、收敛性差和数据饥渴等局限,提出一种基于随机化神经网络的深度学习框架。
  • 通过设计更深的网络结构,克服现有多层RVFL网络性能不佳的问题,同时保留RVFL的优势并支持层次化特征学习。
  • 开发一种高效的集成方法(edRVFL),在单次训练中实现高性能,无需独立训练多个模型,相比传统集成方法显著降低计算成本。
  • 通过将dRVFL和edRVFL框架与稀疏预训练的RVFL变体(SP-RVFL)结合,证明其在多种学习任务中具有通用适用性,提升表征学习能力。
  • 在多个领域的真实世界数据集上验证所提模型,结果表明其在准确率和泛化能力方面具有持续优势。

提出的方法

  • 提出一种包含多层堆叠隐藏层的深度RVFL(dRVFL)网络,其中隐藏层权重和偏置随机初始化并固定,输出权重通过最小二乘优化的闭式解计算得出。
  • 提出一种集成深度学习框架(edRVFL),通过在单次训练中对输入或隐藏层参数施加随机扰动,生成多样化的基模型,避免独立训练多个网络。
  • 采用从输入层到输出层的直接跳跃连接(如标准RVFL中所用),以正则化模型,增强特征复用,提升泛化能力,尤其在低数据场景下表现更优。
  • 将稀疏预训练RVFL(SP-RVFL)变体集成到深度框架中,其中隐藏层参数通过稀疏自编码器学习而非随机初始化,从而提升特征表示质量。
  • 在edRVFL中通过一次前向传播结合多次随机化生成多样化的集成成员,与独立训练多个深度网络相比,显著降低训练成本。
  • 采用统计检验(Friedman检验和Nemenyi检验)验证在13个基准数据集上性能提升的显著性。

实验结果

研究问题

  • RQ1基于RVFL原理的深度神经网络架构是否能在多样化的数据集上实现优于浅层RVFL和标准深度网络的泛化能力?
  • RQ2所提出的edRVFL框架是否能在单次训练中实现与传统集成方法相当的性能,同时显著降低训练成本?
  • RQ3将稀疏预训练集成到RVFL框架中,对深度网络和集成深度网络的性能有何影响?
  • RQ4dRVFL和edRVFL框架是否具备足够的通用性,可与多种RVFL变体(如SP-RVFL)结合,以在不同学习任务中提升性能?
  • RQ5dRVFL和edRVFL在多个基准数据集上相较于ELM、RVFL和SP-RVFL等现有模型所取得的性能提升是否具有统计显著性?

主要发现

  • dSP-RVFL和edSP-RVFL模型在13个数据集上的平均准确率达到94.29%,显著优于基线SP-RVFL(91.7%),Friedman检验的p值<0.05。
  • edSP-RVFL模型在Friedman检验中获得最优平均排名2.03,优于所有其他模型,包括ELM(排名10)和dRVFL(-O)(排名8.73),表明其整体性能更优。
  • 在MNIST数据集上,edSP-RVFL达到95.02%的准确率,较SP-RVFL的91.26%提升3.76%,展现出在图像分类任务中的强大性能。
  • COIL20数据集上,edSP-RVFL(99.72%)相比dSP-RVFL(98.96%)实现1.0%的准确率提升,凸显集成学习在复杂数据集上的增强效果。
  • Nemenyi检验确认,dSP-RVFL和edSP-RVFL均显著优于SP-RVFL,临界差异(CD)为0.92,检验统计量(F_F)为71.23,在α=0.05水平下拒绝原假设。
  • edRVFL框架实现了94.29%的平均准确率和2.3的Friedman排名,表明该集成方法在所有测试数据集(包括RCV1和TDT2)上均能持续提升性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。