关键词multi-task inverse reinforcement learning
搜索结果 - 3
- 常识奖励的多任务逆强化学习
通过将奖励分解为两个不同的部分,即任务特定奖励和常识奖励,并探讨后者如何从专家示范中学习,我们解决了在复杂真实环境中应用强化学习所存在的奖励功能不准确所导致的问题,并证明通过多任务逆向强化学习能够学习到一个有用的奖励函数。
- ICML基于后继特征与逆时序差分学习的示范增强学习 (PsiPhi-Learning)
该研究探讨了如何利用没有奖励标签的演示样本进行强化学习,提出了一种基于继承特征的多任务反向强化学习算法,证明了该算法在零样本迁移方面的有效性和性能上界,并且展示了在几种应用领域的具体应用。
- ICML多任务最大熵逆强化学习
本文提出了在最大因果熵 IRL 框架中的多任务 IRL 的公式化,通过单次模仿学习可以解决单任务 IRL 算法需要数百个演示才能解决的网格环境中的问题,并在常见模拟机器人基准的多任务变体上评估这些 IRL 算法,发现了其严重的限制,并提出了