神经架构搜索 - 3.5 简体中文

Vitis AI 用户指南 (UG1414)

Document ID

UG1414

Release Date

2023-09-28

Version

3.5 简体中文

神经架构搜索 (NAS) 的概念是指，对于任意给定推断任务和数据集，在潜在设计空间内都多个网络架构，这些架构不仅有效而且具有极高的精度得分。通常开发者从熟悉的标准主干（例如，ResNet50）开始，并对该网络进行训练以得到最佳精度。但在许多情况下，计算成本低得多的网络拓扑即可提供相似或更好的性能。对于开发者而言，使用相同数据集来训练多个网络（有时最多局限于使其成为训练超参数）并非选择最佳网络拓扑的有效方法。

NAS 可灵活应用于每个层次。通过最大程度减少剪枝后的网络损失，即可知晓通道数量或稀疏度。NAS 能在速度与精度之间成功达成平衡，但需要大量时间进行训练。此方法需执行四步式进程：

训练
搜索
剪枝
微调（可选）

相比于低精度剪枝，单样本 NAS 实现可将多个候选“子网络”汇编为单个过度参数化的计算图，称为“超网”(Supernet)。训练最优化算法会尝试使用监督学习对所有候选网络同时进行最优化。完成此训练进程后，候选子网络会基于计算成本和精度进行排名。开发者可选择满足自己要求的最适合的候选子网络。单样本 NAS 方法能有效压缩逐通道卷积模型和传统卷积模型，但需要较长的训练时间和较高的技术水平。