基于深度强化学习的曳杆目标多智能体检测

Feb, 2023

基于深度强化学习的曳杆目标多智能体检测

Exposure-Based Multi-Agent Inspection of a Tumbling Target Using Deep Reinforcement Learning

Joshua Aurand, Steven Cutlip, Henry Lei, Kendra Lang, Sean Phillips

TL;DR本研究提出了一种用于自主、鲁棒、去中心化的旋转目标多智能体检查的层次学习方法。采用深度强化学习训练高水平计划器和导航计划器处理点对点导航，对于未知目标几何形状和来自传感器输入的更高保真度的信息论目标，此方法可拓展至鲁棒策略，并在受限信息下成功地检查超过 90% 的非凸旋转目标。

Abstract

As space becomes more congested, on orbit inspection is an increasingly relevant activity whether to observe a defunct satellite for planning repairs or to de-orbit it. However, the task of on orbit inspection it

on orbit inspection multi-agent inspection deep reinforcement learning autonomous nonlinear environment

发现论文，激发创造

利用动力无关的强化学习实现低推力轨道转移

该论文研究了使用强化学习的方法来优化低推力卫星的轨迹设计和自主控制。研究表明这种方法可以学习出几乎最优的引导定律，并且对环境动态的不确定性有很好的适应性。

Oct, 2022

利用深度强化学习从 3DOctree 观测中学习在月球表面抓取

此项研究探讨了使用深度强化学习对月球上基于视觉的机械臂进行抓取操作的智能化控制，通过虚拟环境的数据训练及域随机化技术，实现零样本迁移并成功验证实际机器人在类月环境中的操作效果。

Aug, 2022

分布式多智能体目标搜索和跟踪的高斯过程与强化学习

基于分布式高斯过程的多智能体强化学习技术能够利用深度学习的最新进展，在未知目标上规划和决策，以解决传统方法所依赖的启发式问题，并在硬件实验中展示了在无人机群组上的应用性能和可迁移性。

Aug, 2023

自动驾驶望远镜：离线强化学习的天文观测任务自主调度

用于天文学调度优化问题的强化学习算法，在模拟数据集上经过多次改进和调整后，显示出很高的性能，对于特定的天文学挑战，这是第一次对离线强化学习算法进行比较和评估的研究。

Nov, 2023

连续深度强化学习在分散卫星路由中的应用

这篇论文介绍了基于持续的深度强化学习的低轨卫星星座分散路由的完整解决方案，采用多智能体方法，其中每个卫星作为一个独立的决策制定智能体，通过从附近的智能体接收的反馈来获取环境的有限知识。

May, 2024

多智能体强化学习下的动态避障无人机路径规划

我们提出了一种基于多智能体强化学习的新颖集中训练与分散执行方法，用于在线解决动态避障问题。改进方法采用模型预测控制的思想提高智能体的训练效率和样本利用率，并通过模拟、室内和室外环境的实验结果验证了方法的有效性。

Oct, 2023

分布式卫星路由的多主体深度强化学习

该研究介绍了一种用于低地球轨道卫星链路的多智能体深度强化学习方法（MA-DRL），通过融合全局深度神经网络以及本地预训练 DNN，实现离线学习最优路径并快速适应网络和流量变化，在线实现高效分布式路由。

Feb, 2024

学习环顾四周：智能探索未知任务的未见环境

通过奖励代理的减少未观测环境部分的不确定性的行为，我们提出了一种基于循环神经网络的强化学习方法来实现对自然场景和三维物体的主动完成，并演示了我们的方法学习到的通用策略对于新的未见环境和任务具有较好的泛化性。

Sep, 2017

基于点云强化学习的主动搜索和覆盖

这篇研究论文介绍了一种使用端到端的深度强化学习解决方案来优化移动 3D 传感器的轨迹，以便在整体场景中找到特定的物体并被点云覆盖，实现尽快的目标搜索和覆盖。

Dec, 2023

无人机安全多智能体运动规划中的不确定性下滤波强化学习

我们提出一种可行的、基于强化学习和约束控制轨迹规划的无人机多智能体安全运动规划器，可以处理不确定的、杂乱的工作空间，并确保安全性、避免碰撞。该方法能够实时实施，相对于仅基于学习的方法，训练过程更简单，数值模拟和实验证明了该方法的有效性。

Oct, 2023