搜索引擎优化论文(基于前面所有的节点代表网络的搜索框架跟NASNet等方法一样)

优采云发布时间: 2022-02-02 14:03

　　论文： DARTS：可微架构搜索

　　介绍

　　目前流行的神经网络搜索方法大多选择离散的候选网络，而 DARTS 搜索一个连续的搜索空间，并根据验证集的性能使用梯度下降来优化网络结构。论文的主要贡献如下：

　　可微架构搜索搜索空间

　　DARTS的整体搜索框架与NASNet等方法相同，都是通过搜索计算单元（cell）作为网络的基本结构，然后堆叠成卷积网络或循环网络。计算单元是一个有向无环图，收录有序的节点序列，每个节点代表网络的中间信息（如卷积网络的特征图），边代表操作对。每个计算单元有两个输入和一个输出。对于卷积单元，输入是计算单元前两层的输出。对于循环网络，输入是当前步骤的输入和上一步的状态，两者的输出都结合了中间节点的所有输出。

　　这包括一个特殊的零操作来指定两个节点之间没有连接。DARTS 将计算单元的学习转化为边缘操作的学习。整体搜索框架与 NASNet 等方法相同。本文主要关注 DARTS 如何进行基于梯度的搜索。

　　持续松弛和优化

　　让是一组候选操作，每个代表要应用的功能。为了使搜索空间连续，将原创的离散操作选择转换为所有操作的 softmax 加权输出：

　　节点之间操作的混合权重表示为一个维度向量，整个架构搜索被简化为学习连续值，如图1所示。搜索结束时，每个节点选择概率最高的操作而不是构建最终网络。

　　简化后，DARTS 的目标是同时学习网络结构和所有操作权重。与以前的方法相比，DARTS 能够基于验证集损失使用梯度下降进行结构优化。损失定义为训练和验证集损失。损失由网络结构和网络权重决定。搜索的最终目标是找到最优的，以最小化验证集损失，通过最小化训练损失获得网络权重。这意味着DARTS是一个双层优化问题，使用验证集优化网络结构，使用训练集优化网络权重，对于上层变量，对于下层变量：