BriefGPT.xyz
Ask
alpha
关键词
action quantization
搜索结果 - 2
机器人技能学习的动作量化离线强化学习
我们提出了一种自适应的行动量化方案,通过使用 VQ-VAE 学习状态条件的行动量化,避免了行动空间的指数爆炸问题,并通过离线强化学习方法在基准测试中改进了性能,同时在 Robomimic 环境中的复杂机器人操作任务中,离线强化学习算法通过离
→
PDF
9 months ago
ICML
来自演示的动作量化连续控制
本文提出了一种基于 RL 的新方法 AQuaDem,可从人类演示中学习连续动作空间的离散化,以实现在连续控制问题上的离散动作深度 RL 技术应用,并通过实验证明了优于 SAC 和 GAIL 的性能。
PDF
3 years ago
Prev
Next