Sep, 2024

学习弥合差距:通过规划和强化学习实现高效的新颖性恢复

TL;DR本研究解决了自主机器人在复杂环境中应对新颖情况的决策问题。通过引入一种“桥接策略”,利用强化学习快速适应环境变化,提高了模型在长时间跨度任务中的效率和灵活性。实验表明,该方法比传统的强化学习基线更快速有效,并且具有良好的可推广性,能与规划方法结合,处理更复杂的任务。