[论文解读] Weight Agnostic Neural Networks
本文提出了权重无关神经网络(WANNs),一种能够通过随机初始化权重解决任务而无需传统训练的神经网络架构发现方法。通过在广泛共享的随机权重下优化架构性能,该方法找到了最小但高性能的架构,实现了优异结果——例如在MNIST上达到约92%的准确率,在连续控制任务中获得高奖励,证明了仅靠架构本身即可编码出有效的解决方案。
Not all neural network architectures are created equal, some perform much better than others for certain tasks. But how important are the weight parameters of a neural network compared to its architecture? In this work, we question to what extent neural network architectures alone, without learning any weight parameters, can encode solutions for a given task. We propose a search method for neural network architectures that can already perform a task without any explicit weight training. To evaluate these networks, we populate the connections with a single shared weight parameter sampled from a uniform random distribution, and measure the expected performance. We demonstrate that our method can find minimal neural network architectures that can perform several reinforcement learning tasks without weight training. On a supervised learning domain, we find network architectures that achieve much higher than chance accuracy on MNIST using random weights. Interactive version of this paper at https://weightagnostic.github.io/
研究动机与目标
- 探究神经网络架构本身(无需学习权重)是否能够为复杂任务编码出有效解决方案。
- 开发一种优先考虑架构归纳偏置而非权重优化的搜索方法。
- 评估在精心设计的架构下,随机初始化的权重是否仍能实现高性能。
- 证明最小化架构可在多样化任务中实现强大性能,包括强化学习与监督学习。
- 通过识别具备内在任务特异性能力的架构,推动非梯度学习方法的研究。
提出的方法
- 提出一种搜索框架,将所有权重视为单一共享的随机参数,从固定范围内均匀采样。
- 通过在多个随机权重值上平均性能来评估每种架构,优化该分布下的期望性能。
- 采用基于神经进化的方法(受NEAT启发),通过添加节点、连接以及改变激活函数等操作来演化架构。
- 使用锦标赛选择和变异算子探索架构空间,同时最大限度减少对权重适应的依赖。
- 将该搜索方法应用于强化学习任务(Swing-Up CartPole、Bipedal Walker、Car Racing)和监督学习任务(MNIST)。
- 在评估过程中对所有连接使用固定且共享的权重值,以评估架构对权重初始化的鲁棒性。
实验结果
研究问题
- RQ1神经网络架构本身(不进行任何权重训练)是否能够解决复杂的强化学习任务?
- RQ2在精心设计的架构下,随机初始化的权重在多大程度上仍能实现高性能?
- RQ3能否发现最小化架构,使其在监督学习任务(如MNIST)上实现显著高于随机水平的性能?
- RQ4与标准训练网络相比,权重无关架构在基准任务上的性能如何?
- RQ5在广泛随机权重下优化性能时,会涌现出哪些架构归纳偏置?
主要发现
- 该方法发现了无需任何权重训练即可在连续控制任务(如Bipedal Walker和Car Racing)中实现高性能的最小化神经网络架构,平均回报分别超过300和500。
- 在MNIST数据集上,WANNs仅使用随机权重即实现了约92%的测试准确率,显著高于10%的随机基准水平。
- 表现最佳的WANN架构在广泛共享权重值范围内均表现出稳健性能,顶级网络即使在极端权重值(如±2)下仍能保持高性能。
- 通过策略梯度方法对共享权重参数进行微调可进一步提升性能,表明架构是一种强大的归纳偏置,可通过极少学习进行优化。
- 该方法识别出的架构在某些任务中(如Bipedal Walker)甚至优于使用完整权重训练的标准基线,表明架构中编码了强大的归纳偏置。
- 该方法成功发现了既小巧又高效的架构,例如MNIST的WANN仅使用标准网络5%的连接数,却实现了接近最先进(SOTA)的性能。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。