基于视觉的追逐 - 逃避机器人策略学习

Aug, 2023

基于视觉的追逐 - 逃避机器人策略学习

Learning Vision-based Pursuit-Evasion Robot Policies

Andrea Bajcsy, Antonio Loquercio, Ashish Kumar, Jitendra Malik

TL;DR将从追逐 - 逃避互动中学习战略性机器人行为这一实际约束下的问题转化为一个监督学习问题，其中完全可观测的机器人策略为部分可观测的机器人策略生成监督信号，并发现这个监督信号的质量依赖于两个关键因素：逃避者行为的多样性与最优性的平衡以及完全可观测策略中的建模假设的强度。在野外的追逐 - 逃避互动中，我们部署了这个策略在一台带有 RGB-D 相机的四足机器人上，尽管面临各种挑战，感知限制激发了创造力：机器人在不确定时努力收集信息，从嘈杂的测量中预测意图，并为了拦截而提前预判。

Abstract

Learning strategic robot behavior -- like that required in pursuit-evasion interactions -- under real-world constraints is extremely challenging. It requires exploiting the dynamics of the interaction, and planning through both physical state and latent intent uncertainty. In this pape

strategic robot behavior pursuit-evasion interactions supervised learning partially-observable policy sensing constraints

发现论文，激发创造

基于视觉的自主无人机赛车的深度感觉运动策略学习

通过学习深度的感知动作策略，使用对比学习从输入图像中提取固定特征表示，通过两阶段的作弊式学习框架训练神经网络策略，将视觉驱动的自主无人机竞赛问题转化为了提取原始图像的特征表示进行控制命令推断，无需全局一致的状态估计、轨迹规划和手工控制设计。该方法不仅可使控制策略更具有鲁棒性，而且可以实现与状态法相同的赛车性能，为开发纯靠图像输入控制无人机的智能视觉自主系统铺平了道路。

Oct, 2022

学习主动任务导向的探索策略，弥合模拟与现实之间的差距

本文提出并分析了一种基于任务导向探索的框架，该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数，并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明，任务导向的探索有助于在系统参数未知时，使基于模型的策略适应更好，从而实现更好的任务表现。

Jun, 2020

Active Object Perceiver：基于识别引导的移动机器人目标搜索策略学习

本文通过机器人视觉输入来学习其在室内环境中寻找感兴趣物体的导航策略，并提出了一种基于深度学习和强化学习的新型框架，结合了目标识别模块和动作预测机制，并使用一种新的衰减奖励函数来验证所提方法的有效性，通过模拟和实际机器人实验表明了其方法在平均轨迹长度和成功率方面优于竞争方法。

Jul, 2018

机器人跑酷学习

本文提出了一种以视觉为基础、具有多样化跑酷技能的单一端到端学习系统，使用简单奖励而无需参考动作数据，通过直接配合启发的强化学习方法生成并传输到四足机器人上，使其能够在复杂环境中自主选择并执行适当的跑酷技能。

Sep, 2023

深度学习方法在抓取无形对象方面的应用

本篇论文提出了一种基于深度学习的批判 - 策略方法来解决机器人操作中的困难问题，该问题需要通过一系列推进和抓取动作来捕捉最初看不见的目标物体，并通过自我监督学习的方式进行训练。

Sep, 2019

Dreamitate: 通过视频生成进行真实世界视觉运动策略学习

在这篇论文中，我们提出了一种视觉 - 运动策略学习框架，该框架在给定任务的人类示范中对视频扩散模型进行微调。在测试阶段，我们生成了一个以新颖场景的图像为条件的任务执行示例，并直接使用这个合成的执行结果来控制机器人。我们的主要观点是，使用常用工具可以轻松地弥合人手和机器人操作者之间的具身隔阂。我们在四个复杂度不断增加的任务上评估了我们的方法，并证明利用互联网规模的生成模型使得学习策略可以比现有行为克隆方法实现更高程度的泛化。

Jun, 2024

基于数据驱动的模仿学习规划

利用数据驱动的模仿学习框架，通过模仿一个清晰的预测者，解决了机器人规划中的优化问题，从而为序列决策制定了更好的战略。在信息不完整的计划问题上进行了验证，包括真实的无人机实验，并且表现优于现有的算法。

Nov, 2017

通过深度强化学习从自我中心视觉中学习机器人足球

我们运用多智能体深度强化学习（RL）通过自我中心的 RGB 视觉训练端到端的机器人足球策略，解决了现实世界机器人领域中的许多挑战，包括主动感知、灵活的全身控制和长时间跨度的计划等。该论文是首次展示了通过将原始像素观测映射到关节级动作的端到端多智能体机器人足球的训练，并能够在真实世界中部署。

May, 2024

末端到端的视觉运动控制的可供性学习

采用模块化神经网络体系结构，利用合成数据和模拟技术，通过低维潜在表示生成场景可用性，成功训练机械臂政策。同时，提出了一种数据集生成方法，可轻松推广到新任务、对象和环境，无需手动像素标记。

Mar, 2019

深度视觉动作策略的端到端训练

该研究旨在回答：联合端到端训练感知和控制系统是否比单独训练每个组件提供更好的性能？通过使用卷积神经网络表示，并在一系列需要视觉和控制之间紧密协作的真实世界操纵任务上进行评估。

Apr, 2015