一种可扩展的强化学习方法，用于在群体与群体交战问题中进行攻击分配

Oct, 2022

一种可扩展的强化学习方法，用于在群体与群体交战问题中进行攻击分配

A Scalable Reinforcement Learning Approach for Attack Allocation in Swarm to Swarm Engagement Problems

Umut Demir, Nazim Kemal Ure

TL;DR本文提出了一种强化学习 (RL) 框架，用于控制一大规模群体的密度以对抗敌对群体攻击。通过将群体对抗问题建模为马尔科夫决策过程并开发出 RL 算法，可在不了解敌对群体策略 / 动态的情况下计算出对抗策略，模拟结果表明，所开发的框架可以以高效的方式处理各种大规模对抗场景。

Abstract

In this work we propose a reinforcement learning (RL) framework that controls the density of a large-scale swarm for engaging with adversarial swarm attacks. Although there is a significant amount of existing work in applying artificial intelligence methods to →

reinforcement learning swarm control adversarial swarms markov decision process engagement strategies

发现论文，激发创造

针对群体间交互问题的可扩展规划和学习框架开发

本研究基于强化学习算法提出了一种将大规模群体冲突问题分解为多个独立的多代理追逐 - 逃脱游戏的框架，该框架通过模拟多种多代理追逐 - 逃脱场景，使用算法来最大效率地消灭敌方群集，从而验证了这种方法的有效性。

Dec, 2022

面对高不确定性的群体对抗的层次强化学习

基于分层强化学习的群体机器人对抗方法，通过解耦离散分配层和连续规划层，利用概率集成模型量化不确定性并自适应调节交互频率，以应对未知策略和动态障碍引起的高度不确定性。预训练和交叉训练的整合训练方法提高了训练效率和稳定性，实验证明了该方法的有效性和泛化性能。

Jun, 2024

可扩展的基于任务驱动的机器人群控制：碰撞回避和学习的均场控制

本文提出了一种基于均场控制的智能机器人群体行为设计框架，结合碰撞避免和均场控制学习，通过单智能体分布控制实现多智能体分布控制，实现分布式开环应用并避免碰撞，并在理论和实践上对其进行了有效性验证。

Sep, 2022

群体系统的深度强化学习

提出了一种基于分布的平均嵌入（mean embeddings）状态表示法，适用于具有大量同质代理的群集系统；在深度多智能体强化学习中利用神经网络方式实现的平均嵌入表示法可实现最丰富的邻近智能体信息交换，促进更复杂的集体策略的发展。

Jul, 2018

群体系统中的逆强化学习

本文提出了一种基于 SwarMDP 框架的针对分布式多智能体相互作用的逆向强化学习算法，在该框架中，我们证明了与智能体相关的值函数相等，通过引入一种新异构学习策略，我们证明了该框架能够有效地产生有意义的本地奖励模型。

Feb, 2016

分散化强化学习多机器人编队控制

基于强化学习算法的分布式多机器人编队控制，并采用 DDQN 算法，通过离散机器人运动来适应连续非线性系统，无需复杂数学模型和非线性控制器即可在模拟和实验中实现稳定编队。

Jun, 2023

群体系统的引导深度强化学习

本文研究了如何使用有限的传感能力控制一组合作智能体，使用了基于演员 - 评论家算法的深度强化学习以近似 Q 值函数和策略评估，评估了在寻找和维持距离和定位目标方面的性能。

Sep, 2017

使用对抗种群的鲁棒强化学习

利用强化学习中的对抗噪音和以聚集对手人口作为训练方法，改善了机器人领域中强化学习中的鲁棒性和泛化性能。

Aug, 2020

深度增强学习的深度攻击

通过强化学习实现攻击，在考虑攻击效果和匿名性的前提下，使用新的攻击性能指标对此方法进行评估，初步实验结果表明了该方法的有效性、鲁棒性和可转移性。

May, 2022

使用对抗训练提高强化学习在电力系统控制中的鲁棒性

本文针对电网控制系统的弱点进行研究，发现现有的强化学习算法存在敏感性，容易受到恶意攻击，提出了一种基于对抗训练的解决方案，以增强算法的安全性和鲁棒性。

Oct, 2021