Jul, 2020

基于环境感知元强化学习的可迁移网络结构搜索

TL;DR提出了一种名为CATCH的基于上下文的元强化学习算法,它通过利用元学习和强化学习结合的方法,在转移学习的场景下高效地搜索出最优网络结构,并在ImageNet、COCO和Cityscapes数据集上展示出了鲁棒性。该算法通过将任务属性编码成潜在上下文变量,然后指导其控制器快速捕捉表现最佳的网络。