关键词demonstrations
搜索结果 - 54
  • 学习利用先前行为解决任务
    PDFa year ago
  • WWWAR2-D2 无需实体机器人训练机器人
    PDFa year ago
  • 基于策略的样本高效观测模仿学习
    PDFa year ago
  • 分解和修复:使用期权提高模仿学习对抗示范的性能
    PDFa year ago
  • 基于覆盖率的上下文学习示例选择
    PDFa year ago
  • Self-ICL: 自生成示范的零样本上下文学习
    PDFa year ago
  • OpenVR: 操作远程操作的遥控器
    PDFa year ago
  • DEFENDER: 使用演示进行基于 DTW 的情节过滤,以增强 RL 安全性
    PDFa year ago
  • 多目标多智能体决策中的演示推理
    PDFa year ago
  • 思维链预测控制
    PDFa year ago
  • 使用示范加速强化学习和规划:一项调查
    PDFa year ago
  • 基于语言引导的仿真学习任务适应
    PDFa year ago
  • MoDem: 利用演示加速视觉基于模型的强化学习
    PDF2 years ago
  • 利用潜在空间先验的示范利用
    PDF2 years ago
  • 蒙特卡罗增强演员 - 评论家算法处理来自次优演示的稀疏奖励深度强化学习
    PDF2 years ago
  • 强化学习入门
    PDF2 years ago
  • 推理反事实以改善人类逆强化学习
    PDF2 years ago
  • EMNLP重新思考演示的作用:何为情境学习的关键?
    PDF2 years ago
  • ICML来自演示的动作量化连续控制
    PDF3 years ago
  • 离线强化学习的半监督奖励学习
    PDF4 years ago