BriefGPT.xyz
Ask
alpha
关键词
observation histories
搜索结果 - 2
基于观测历史的离线强化学习:分析和改善采样复杂度
标准离线强化学习算法在观测历史的条件下存在样本复杂度高的问题,然而通过引入双模拟损失函数,离线强化学习可以显式地优化该损失函数,从而在性能上得到改善。
PDF
8 months ago
ICML
以关键帧为中心的视觉模仿学习
该研究提出了一种通过加强模仿的关键帧来改进模仿学习的方法,以在视觉模仿等现实场景中实现更好的性能表现,并在基于图像和基于视觉的控制任务中进行了验证。
PDF
3 years ago
Prev
Next