Feb, 2024

提升长延迟强化学习与辅助短延迟任务

TL;DR在延迟场景中,强化学习面临挑战,本研究提出了一种新颖的辅助延迟强化学习方法(AD-RL),通过在短延迟任务中学习价值函数,并应用于长延迟任务中,以显著减少样本复杂性和提高策略性能。