关键词human demonstrations
搜索结果 - 21
  • 超越查询:通过强化学习训练更小的语言模型进行网络交互
    PDF3 months ago
  • MimicGen:一个用于可扩展机器人学习的数据生成系统,利用人类演示
    PDF8 months ago
  • TimewarpVAE:轨迹的同时时间扭曲与表示学习
    PDF8 months ago
  • 一份 ACT 戏剧表演:单一演示行为克隆与行动分块变压器
    PDF10 months ago
  • Generative Pre-trained Heterogeneous Graph Transformer 学习面向目标的软物体操作技能
    PDFa year ago
  • 学习基于视频的策略用于未见过的操纵任务
    PDFa year ago
  • PIRLNav:利用模仿与强化学习微调的预训练方法实现物体导航
    PDFa year ago
  • 交互自主学习偏好
    PDF2 years ago
  • 行为变换器:一石多鸟地克隆 $k$ 种模式
    PDF2 years ago
  • MM通过自动课程学习从单个人类演示中学习指导多个异构角色在星际争霸 II 中
    PDF2 years ago
  • 学习的李群上的反应式运动生成
    PDF2 years ago
  • ACL如何激励你的巨龙:教授目标驱动型智能体在奇幻世界中说话和行动
    PDF4 years ago
  • 欧几里得流形变换:用于学习稳定动力系统的微分同胚约简
    PDF4 years ago
  • 使用动态系统学习约束运动规划的障碍函数
    PDF4 years ago
  • 关于 2019 年 MineRL 竞赛在样本高效强化学习方面的回顾分析
    PDF4 years ago
  • IJCAIMineRL: 一个大规模的《Minecraft》演示数据集
    PDF5 years ago
  • MineRL 2019 赛事:基于人类先验知识的高效强化学习
    PDF5 years ago
  • 深度强化学习下的灵巧操作:高效、通用和低成本
    PDF6 years ago
  • 使用深度强化学习和演示学习复杂的手部操作技能
    PDF7 years ago
  • 使用人类演示进行神经网络预训练的深度强化学习
    PDF7 years ago
Prev