BriefGPT.xyz
Ask
alpha
关键词
hierarchical control
搜索结果 - 5
从 LLMs 到行动:潜在代码作为层次机器人控制中的桥梁
我们提出了一种名为 LC (学习型潜在代码桥接) 的新方法,用于在层次控制中克服自然语言的限制,并实现端到端微调,以在需要推理和多步行为的任务中优于仅使用纯语言作为接口层的基线。
PDF
2 months ago
用于模拟四足机器人的分层式去中心化深度强化学习架构
本文探讨了分散式和分层式控制对于机器人运动控制的优劣,并提出一种新的架构作为解决方案,实验表明分层式并行控制更能够支持学习、节能、能适应未知环境并解决复杂目标任务。此外,本文还强调了分层结构中模块化设计的重要性。
PDF
2 years ago
GANimator: 单序列的神经运动合成
GANimator 是一种生成模型,可以从单个短动作序列中学习合成新的运动,既出现了原始运动的核心元素,同时又合成了新的和多样化的运动,是一种新的动作合成方法。
PDF
2 years ago
MAVEN: 多智能体变分探索
本文提出一种名为 MAVEN 的新方法,该方法结合了价值和基于策略的方法,引入了层次控制的潜在空间来解决 QMIX 和类似方法中的行动值表示约束引起的探索不足和次优现象。MAVEN 可以实现承诺和延时探索,在具有挑战性的 SMAC 动态负载
→
PDF
5 years ago
ICML
RLlib:分布式强化学习的抽象化
通过采用自上而下的分层控制算法,对 RL 组件进行可组合的分布式处理,RLlib 提供可扩展的软件基元,从而将并行性和资源需求封装在短暂的计算任务中,实现高性能、可扩展性和大量代码重用的广泛算法的实现。
PDF
7 years ago
Prev
Next