BriefGPT.xyz
Ask
alpha
关键词
reward-sparsity
搜索结果 - 1
从语义到执行:将动作规划与强化学习相结合,用于机器人因果问题解决
本文介绍了一种基于奖励稀疏性的桥梁方法,将符号行动计划和强化学习相结合,以解决在噪声条件下涉及工具使用和复杂因果依赖的对象操作问题,并成功利用了数据和知识。
PDF
5 years ago
Prev
Next