雷锋网AI科技评论:循环网络来生成神经网络中的模型描述

雷锋网AI科技评论出版社:4月24-26日,ICLR 2017在法国土伦召开。雷锋网AI科技评论编辑走上前台,带来大会第一线报道。期间,雷锋网还将围绕会议议程和论文介绍进行系列报道和专题报道,敬请期待。

神经网络是强大而灵活的模型,在图像、语音和自然语言理解等学习任务上表现良好。尽管神经网络取得了成功,但设计一个好的神经网络仍然非常困难。为了让设计神经网络变得简单,Google Brain 团队发表了一篇名为《Neural Architecture search with Reinforcement Learning》的论文,该论文使用循环网络在神经网络中生成模型描述,并通过强化学习训练这个 RNN,以最大限度地提高架构的准确性在验证集中生成。

该论文的作者之一 Quoc V. Le 是斯坦福大学机器学习大师吴恩达先生的博士生,雷锋网获悉,该论文将在今天的 ICLR 会议上作为第四次投稿演讲进行讨论.

以下是根据论文内容对雷锋网AI技术评论的部分汇编。

抽象的

在过去的几年里神经网络参数初始化,许多深度神经网络在语音识别、图像识别、机器翻译等具有挑战性的任务上取得了巨大的成功。随着神经网络的发展,研究人员的重点已经从特征设计转向架构设计,例如从SIFT、HOG算法,到AlexNet、VGGNet、GoogleNet、ResNet等网络架构设计。尽管这些方法看起来更简单,但设计网络架构仍然需要大量专业知识并且非常耗时。

Google Brain 团队提出了神经架构搜索,它使用基于梯度的方法来寻找最优架构。过程如上图所示。由于神经网络的结构可以由特定的可变长度字符串引用,因此可以使用循环神经网络(控制器)生成该字符串。使用真实数据训练字符串引用的网络(“子网络”),并获得验证集的准确性。然后使用强化学习训练RNN,并以准确率作为奖励信号,即可以计算策略梯度以更新控制器。因此,在下一次迭代中,控制器有更大的机会生成能够达到更高精度的架构。换句话说,控制器可以学习如何改进其搜索。

本文的结果表明,神经架构搜索可以设计一个很好的模型,并且对于 CIFAR-10 数据集上的图像识别,神经架构搜索可以找到一种新颖的卷积网络模型,这比目前的手动设计要好。该模型更好,在测试集上的错误率为 3.84,同时比当前最好的人工模型快 1.2 倍。在 Penn Treebank 数据集的语言模型中,神经架构搜索设计了比之前的 RNN 和 LSTM 架构更好的模型,perplexity 为 62.4,这是对 state-of-the-art 人工方法。@3.6.

使用递归神经网络生成模型描述

神经网络架构的超参数是使用控制器生成的,该控制器被选为具有灵活性的循环神经网络。下图显示了一个前馈神经网络,只有卷积层进行预测,控制器将生成的超参数视为一系列符号。

图片[1]-雷锋网AI科技评论:循环网络来生成神经网络中的模型描述-老王博客

在实验中,如果网络的层数超过一定值,生成架构就会停止。该值遵循一定的策略,并随着训练过程而增加。一旦控制器 RNN 完成了架构的生成,它就会开始使用该架构构建和训练神经网络。网络收敛后,记录网络在验证集中的准确率,并优化控制器RNN的参数,以最大化控制器提出的架构的预期验证准确率。

强化学习训练

控制器预测的模型描述可以看作是设计子网络的一系列动作。训练子网收敛后神经网络参数初始化,子网在holdout数据集上得到一个准确率R。使用准确度 R 作为奖励信号,并使用强化学习训练控制器。

实验结果

CIFAR-10 数据集上的卷积架构学习

搜索空间是一个卷积结构,使用非线性层和批量归一化。对于每个卷积层,控制器需要选择[1,3,5,7]中过滤器的宽度和高度以及[24,36,48,64]中过滤器的数量。

RNN 控制器是一个两层 LSTM,每层有 35 个隐藏单元。使用 ADAM 优化器训练,学习率 0.0006。控制器权重在 -0.08 和 0.08 之间平均初始化。而对于分布式训练,使用 800 个 GPU 同时训练 800 个网络。在 RNN 控制器确定架构后,构建子网络并训练 50 个 epoch。在控制器训练过程中,控制器每确定1600个网络架构,网络深度就增加2,初始网络深度为6。

在控制器训练了 12,800 个架构后,获得了最高的验证集准确度。与其他方法的精度对比如下图所示:

在 Penn Treebank 数据集上学习循环网络架构

训练过程与CIFAR-10实验基本相同,最终结果如下:

摘要:本文提供了一种使用 RNN 构建神经网络模型的方法。通过使用循环神经网络作为控制器,该方法可以灵活地在不同的结构空间中进行搜索。该方法在一些具有挑战性的数据集上具有良好的性能,也为自动构建高质量的神经网络架构提供了新的研究方向。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论