关键词long-horizon tasks
搜索结果 - 33
  • 使用基于模型的离线强化学习解决长期任务
    PDF6 days ago
  • 双向可达层次强化学习与相互响应策略
    PDF10 days ago
  • 带大型语言模型线索的世界模型用于目标实现
    PDF25 days ago
  • 喊叫您的机器人:从语言纠正中实时改进
    PDF4 months ago
  • 关于基于语言条件技能发现的互信息思考与模仿学习
    PDF4 months ago
  • AAAISemTra: 跨领域零样本策略适应的语义技能转换器
    PDF5 months ago
  • 简单层次规划与扩散
    PDF6 months ago
  • LHManip:用于杂乱桌面环境中的长时程语言驱动操作任务的数据集
    PDF7 months ago
  • AAAIGO-DICE:目标导向的基于选项感知的离线模仿学习通过稳态分布修正估计
    PDF7 months ago
  • 通过集成程序合成和状态机来解决长期任务
    PDF7 months ago
  • JARVIS-1: 开放世界多任务智能体及伴有增强记忆的多模态语言模型
    PDF8 months ago
  • 制作一个甜甜圈:零样本变形物体操作的语言引导层次 EMD 空间规划
    PDF8 months ago
  • 自我提升技能:借助大型语言模型指导学习解决新任务
    PDF9 months ago
  • 组合式层次规划的基础模型
    PDF10 months ago
  • 连续灵巧性:将灵巧策略链接起来实现长程操纵
    PDF10 months ago
  • 基于人类评估反馈的原始技能基础机器人学习
    PDFa year ago
  • RL$^3$: 通过 RL 内外的 RL$^2$ 提升元强化学习
    PDFa year ago
  • NetHack 难以攻破
    PDFa year ago
  • E-MAPP: 高效的并行程序指导多智能体强化学习
    PDF2 years ago
  • STAP: 无序列任务策略
    PDF2 years ago
Prev