关键词behavior cloning
搜索结果 - 36
  • 离线强化学习中创建信任区域的扩散策略
    PDFa month ago
  • 扩散策略攻击者:针对基于扩散的策略的制造对抗攻击
    PDFa month ago
  • ADR-BC: 敌对密度加权回归行为克隆
    PDFa month ago
  • MaskFuser: 联合多模态符号化的遮罩融合用于端到端自动驾驶
    PDF2 months ago
  • 机器人空气曲棍球:用强化学习进行机器人学习的操纵测试平台
    PDF2 months ago
  • SAFE-GIL:安全引导的模仿学习
    PDF3 months ago
  • 自主驾驶路径规划的残差链预测
    PDF3 months ago
  • 从示范中学习视觉四足机器人的运动和操作技能
    PDF3 months ago
  • SOTOPIA-$π$: 社交智能语言代理的交互学习
    PDF4 months ago
  • 反向软 Q 学习用于离线模仿与次优示范
    PDF4 months ago
  • 离线强化学习和模仿学习的引导式数据增强
    PDF8 months ago
  • SGD 噪声的蝴蝶效应:行为克隆和自回归中的误差放大
    PDF9 months ago
  • 多模态大型语言模型用于视觉导航
    PDF9 months ago
  • 记忆一致的神经网络用于模仿学习
    PDF9 months ago
  • 超越均匀采样:利用不平衡数据集的离线强化学习
    PDF9 months ago
  • 一份 ACT 戏剧表演:单一演示行为克隆与行动分块变压器
    PDF10 months ago
  • 去交织模仿学习的初始状态干预
    PDFa year ago
  • 基于时空热力图的模仿学习:NuPlan 挑战赛第二名方案
    PDFa year ago
  • WWWAR2-D2 无需实体机器人训练机器人
    PDFa year ago
  • SwiftSage:一种具备快、慢思维能力的生成性代理,用于复杂交互任务
    PDFa year ago
Prev