[论文解读] MONAS: Multi-Objective Neural Architecture Search using Reinforcement Learning
MONAS 使用强化学习来搜索平衡准确性与其他目标(如功耗)的神经网络架构,MONAS-S 扩展到权重共享以提高可扩展性。
Recent studies on neural architecture search have shown that automatically designed neural networks perform as good as expert-crafted architectures. While most existing works aim at finding architectures that optimize the prediction accuracy, these architectures may have complexity and is therefore not suitable being deployed on certain computing environment (e.g., with limited power budgets). We propose MONAS, a framework for Multi-Objective Neural Architectural Search that employs reward functions considering both prediction accuracy and other important objectives (e.g., power consumption) when searching for neural network architectures. Experimental results showed that, compared to the state-ofthe-arts, models found by MONAS achieve comparable or better classification accuracy on computer vision applications, while satisfying the additional objectives such as peak power.
研究动机与目标
- 促使自动神经网络架构搜索在预测准确性与资源相关目标(如功耗)之间取得平衡。
- 提出 MONAS,一个基于强化学习的框架,将多目标整合到搜索过程。
- 展示对应用特定约束的适应性,并将 MONAS 应用于 AlexNet 风格和 CondenseNet 风格的模型族。
- 引入 MONAS-S,通过使用权重共享来处理更大的搜索空间的可扩展扩展。
提出的方法
- 使用单层基于 LSTM 的控制网络(RNN)作为控制器,为目标 CNN 生成超参数。
- 用生成的超参数训练目标网络,并将其验证准确性和功耗用作对控制器的奖励。
- 应用策略梯度强化学习来更新控制器参数,奖励将准确性与能量(或其他约束)结合在一起。
- 定义多种奖励函数以实现不同的优化目标,包括混合准确性-能量权衡与基于约束的奖励。
- 通过采用权重共享搜索(有向无环图 DAG)来预训练共享权重并在极大搜索空间中加速搜索,将 MONAS 扩展为 MONAS-S。
- 通过 GPU 配置文件(峰值/平均功耗)和 MAC 运算来衡量奖励,以估算能源和计算成本。

实验结果
研究问题
- RQ1MONAS 是否能够适应不同的多目标奖励函数与约束?
- RQ2MONAS 在多大程度上高效引导搜索进入满足功耗或准确性约束的区域?
- RQ3在不同奖励配置下,帕累托前沿如何变化?
- RQ4在多目标目标下,MONAS 是否能够发现超越最先进基线的架构?
- RQ5MONAS-S 是否可扩展到非常大的搜索空间,同时保持能效导向目标?
主要发现
- MONAS 将搜索引导至满足约束的架构,比随机搜索更高效。
- 混合奖励中的不同 alpha 设置将搜索引导到更高的准确性或更低的能量,显示出可控的权衡。
- MONAS 发现处于帕累托前沿的架构,在准确性和能效方面可超越 CondenseNet 基线。
- MONAS-S 可扩展到极大的搜索空间(例如 1.6e29 种可能性),并偏向较低的 MAC 运算同时保持准确性。
- 与 ENAS 相比,MONAS-S 产生目标网络具备更低的 MAC 运算和更有利的逐层运算分布。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。