Dec, 2022

资源受限的增强学习中高效的探索

TL;DR该研究形式化了有限资源下的强化学习问题,并提出了一种新颖的资源感知探索奖励,RAEB可以显著提高在资源受限的强化学习环境中的样本效率,最高可提升一个数量级。