通过延迟策略学习改善空中和陆地移动机器人控制的泛化性能

Jun, 2024

通过延迟策略学习改善空中和陆地移动机器人控制的泛化性能

Improving Generalization in Aerial and Terrestrial Mobile Robots Control Through Delayed Policy Learning

Ricardo B. Grando, Raul Steinmetz, Victor A. Kich, Alisson H. Kolling, Pablo M. Furik...

TL;DR通过延迟策略更新技术（DPU）对航空和陆地移动机器人进行的分析表明，这种技术极大地缓解了推广能力不足的问题，并加速了代理的学习过程，提高了它们在各种任务和未知场景中的效率。

Abstract

deep reinforcement learning (DRL) has emerged as a promising approach to enhancing motion control and decision-making through a wide range

deep reinforcement learning motion control decision-making delayed policy updates generalization

发现论文，激发创造

异步离线更新下的机器人操作深度强化学习

本文介绍一种基于深度 Q 函数算法的深度强化学习方法，能够实现在真实的物理机器人上进行复杂的 3D 操作任务学习，并通过多个机器人异步汇聚优化策略更新等技术进一步提高训练效率。

Oct, 2016

深度预测策略训练采用强化学习

通过使用深度预测策略训练框架，该研究提出了一种有效的方法来训练预测动作策略，使用合成和模拟训练样本来强制进行视觉和运动数据的抽象，以及使用策略搜索强化学习方法来训练每个任务的策略超层，该框架在 PR2 机器人上训练物体抓取和投球等技能任务，并且训练样本只使用了约 180 次实际机器人尝试，达到了很好的效果。

Mar, 2017

一种用于无人机自主降落平台的深度强化学习策略

本文阐述了如何将深度强化学习算法应用于机器人领域，主要关注于以物理模拟平台为基础的无人机飞行任务控制，使用基于 Gazebo 的强化学习框架进行训练，最终成功实现了无人机自主降落的任务

Sep, 2022

自主车辆运动规划深度强化学习调查

本文研究了在自动驾驶车辆领域中，传感器技术、通信、安全、人工智能、机器学习、路线规划等多方面的应用，重点阐述了一种基于深度强化学习的层次运动规划方法，并以车跟、车道保持、轨迹跟踪、融合和交通压力等不同场景的自动驾驶为例，总结了现有解决方案的优缺点并提出未来研究方向和挑战。

Jan, 2020

面向任务驱动的探索，加速具有时态逻辑任务规范的深度强化学习

通过自动机表示 LTL 任务以及部分模拟未知系统动力学的神经网络，我们提出了一种新颖的深度强化学习（DRL）算法，其样本效率得以提高，能够更快速地学习控制策略，以在未知环境中的机器人导航任务中提高效率。

Nov, 2023

基于双重强化学习技术的地面移动机器人增强低维度感知无地图导航

通过比较分析基于深度 Q 网络（DQN）算法和基于双重深度 Q 网络（DDQN）算法的深度强化学习（Deep-RL）策略，本研究提出了两种不同的方法，旨在增强地面移动机器人的无地图导航能力。这些方法中的智能体利用来自激光范围采样的 24 个测量，以及与目标的位置差异和方向相关的智能体位置数据，通过融合这些数据来影响导航决策，从而最终控制机器人的速度。实验结果表明，相比于简单的 Q 结构，双重深度结构显著提高了移动机器人的导航能力，且无需依赖于复杂的感知输入，如基于图像的方法。

Oct, 2023

利用深度强化学习进行无地图水空混合飞行器导航与环境通用化

本文介绍了一种基于最新的 actor-critic 算法的新方法，以解决 HUAUV 的导航和介质转换问题。我们展示了一种双重评论家 Deep-RL 的方法，通过仅使用范围数据和相对定位来提高 HUAUV 的导航性能。我们的 Deep-RL 方法在不同模拟场景中实现了学习的坚实泛化，表现出更好的导航和转换能力，优于以前的方法。

Sep, 2022

面向多无人机协助边缘计算的个性化联邦深度强化学习轨迹优化

在 5G 移动通信时代，研究聚焦于无人机和移动边缘计算技术方面出现了显著增长。本研究提出了一种名为个性化联邦深度强化学习（PF-DRL）的新解决方案，用于多无人机轨迹优化。模拟结果表明，该算法具有更快的收敛速度和改善服务质量，优于其他基于深度强化学习的方法。

Sep, 2023

基于深度强化学习的无人机无线数据采集路径规划

该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据，以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制，从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束，在各种场景参数下做出运动决策。

Jul, 2020

集体机器人分布式异步引导策略搜索强化学习

本文探讨了分布式异步策略学习作为实现机器人具备普适性和提高复杂任务训练效率的手段。实验证明，使用这种方法可以提高机器人对任务的泛化、利用和训练时间效率，从而在视觉门开启任务中取得更好的效果。

Oct, 2016