Jun, 2024

具有前瞻信息的强化学习

TL;DR通过利用先验信息,我们设计了一种能够有效地学习和处理未知环境中的强化学习问题的算法,大大提高了收集奖励的效率。