BriefGPT.xyz
大模型
Ask
alpha
关键词
real robot applications
搜索结果 - 1
相互对齐迁移学习
通过强化学习在模拟环境中训练机器人并结合补充奖励策略,与真实机器人进行进一步的微调来优化探索策略,实验结果表明,这种相互对齐的方法可以在真实和模拟环境中实现更好的性能。
PDF
7 years ago
Prev
Next