Sep, 2023

循环超网络在元强化学习中的强大能力

TL;DR深度强化学习中的元强化学习通过学习可以进行少样本训练的方式来解决样本低效问题。本文通过实证调查发现,当与超网络结合时,远比现有专门方法更简单的循环网络可以实现最强的性能。