BriefGPT.xyz
Ask
alpha
关键词
inverse rl
搜索结果 - 4
利用逆增强学习实现机械抽栓手术中导管和导丝的自主导航
利用逆强化学习 (IRL) 探索了在机械血栓切除 (MT) 血管中实现自主导航的可行性,通过利用专家演示推断奖励函数并采用软演员 - 评论家算法 (soft actor-critic) 进行模型训练,结果表明通过奖励塑造来训练模型可以改进
→
PDF
18 days ago
AAAI
任务分阶段:从示范中自动学习课程
本文介绍了一种基于任务分阶段的机器学习方法,通过逐步提高任务复杂度并调节反馈信息,针对稀疏奖励问题下的强化学习进行探索,并取得了较好成果。
PDF
2 years ago
用逆强化学习改写历史:后见推断对政策改进的影响
本文介绍了逆强化学习(inverse RL),采用逆强化学习方法来实现目标重标记技术(goal-relabeling techniques),并证实在多任务设置下,包括目标达成、具有离散奖励集合和线性奖励函数的领域中,使用逆强化学习加速了学
→
PDF
4 years ago
ICLR
半监督强化学习技能泛化
本文研究了如何在有限的标注数据下,通过半监督强化学习及反强化学习等方法,使机器人等强化学习智能体在探索未知领域时能够获得更好的泛化效果,并评估了该方法在基于图像的控制任务上的表现。
PDF
8 years ago
Prev
Next