- 面对高不确定性的群体对抗的层次强化学习
基于分层强化学习的群体机器人对抗方法,通过解耦离散分配层和连续规划层,利用概率集成模型量化不确定性并自适应调节交互频率,以应对未知策略和动态障碍引起的高度不确定性。预训练和交叉训练的整合训练方法提高了训练效率和稳定性,实验证明了该方法的有效 - 面向集体网络物理系统的软件工程
今天的分布式和普适计算涉及到大规模的网络生态系统,这些系统由密集和大型设备网络组成,这些设备可以进行计算、通信和与环境及人进行交互。本文探讨了在软件工程中这种 “集体计算范式” 的动机、现状和影响,讨论了其特殊的挑战,并概述了未来研究的路径 - 利用谱群体机器人听取一个竞技场的形状
通过构建具备全局认知能力的自动机群,基于扩散模型,利用 Laplacian 算子分析环境,识别并分类不同的场景形状,验证了光谱自动机群在复杂条件下的有效性,并为适应未知地形、分工与共识形成等挑战性任务提供了一种可行的解决方案。
- 进化异质群体中专业集体行为的形成
通过表型可塑性在模拟机器人群体中研究专门化的集体行为的出现,并设计了一种在线调节机制来增强整体性能和可扩展性。
- 学习具有时空图神经网络的分散集群控制器
该研究使用图神经网络(GNNs)探索了在群体机器人中进行分散控制的方法,提出了一种名为 STGNN 的时空 GNN 模型,通过空间和时间的扩展收集和整合更广泛的信息,证明了其在实现凝聚性集群行为、领导跟随和障碍物避让任务方面的潜力。
- 基于深度强化学习的群体机器人移动感知计算卸载
通过利用移动边缘计算来减轻计算负担,本文提出了一种基于在边缘服务器端的可移动感知深度强化学习模型的有效解决方案,用于计算调度和资源,结果表明该方法可以通过使用最少的机器人能量满足延迟要求并保证计算精度。
- 演化多目标神经网络控制机器人群
该研究提出了一种多目标进化神经网络方法,用于开发群体机器人的控制器。该方法通过低保真度的 Python 模拟器训练群体机器人控制器,然后在高保真度的 Webots 模拟环境中进行测试。结果表明,该方法可以有效控制每个机器人,且控制器具有可扩 - 基于超低功耗深度学习的纳米四轴飞行器单目相对定位
本研究提出了一种通过深度神经网络解决双对等纳米无人机的单目相对定位的新型自治端到端系统,从数据集收集到最终的实地部署,包括数据集增强、量化和系统优化。实验结果表明,我们的 DNN 可以通过使用低分辨率单色图像,在最多 2 米的距离内精确定位 - 机器人集群的连续环境估计:相关网络与决策制定
研究探索了利用分散的机器人系统在无限制的环境中实现环境特征平均值的共识,以及在平均值处理时网络拓扑结构、精度误差等因素的因果关系,并提出了一个有效的控制算法,并展示了其在机器人群实验中的效果和应用前景。
- 基于深度学习模型的协同自动驾驶载具编队在路口的协调控制
本文提出了一种通过结合深度学习和在线搜索的算法(AlphaOrder)来解决无信号交叉口机器人交通的最优通过顺序问题,该算法可用于实时生成近似最优的通过顺序,并可以用于管理多个自动引导车(AGVs)和无人机(UAVs)等机器人的抢占式资源共 - 可扩展的基于任务驱动的机器人群控制:碰撞回避和学习的均场控制
本文提出了一种基于均场控制的智能机器人群体行为设计框架,结合碰撞避免和均场控制学习,通过单智能体分布控制实现多智能体分布控制,实现分布式开环应用并避免碰撞,并在理论和实践上对其进行了有效性验证。
- PheroCom 基于虚拟信息素和振动声通信的分散异步群体机器人协调
本论文提出了一种基于分布式模型的虚拟荷尔蒙建模的群体机器人协同方案,通过实现机器人之间的信息交互和知识共享,实现了机器人的分散化和异步化协同,以及高效地完成了目标监视任务。
- HeRo 2.0:一种用于群体机器人研究的低成本机器人
本文介绍了一个新的低成本机器人平台,用于群体机器人应用,具有 3D 打印机身和开源软件,与 ROS(机器人操作系统)深度集成,并执行了实验以评估其功能和适用性。实验结果表明,该平台非常适合群体机器人的研究和教育。
- 有界拉伸标记群体机器人重新配置的协同运动规划
该研究论文在协同运动规划和群体机器人方面取得了突破,提出了一种恒定算法以最小化协同平行运动计划的执行时间,并证明了最小执行时间的找到是 NP 难问题。
- 基于主动偏好学习的强化学习 APRIL
本文提出了一种基于偏好反馈的强化学习算法,结合了主动排序策略,能够在具有限先验知识(如群体机器人)的情景下,使用专家反馈指导智能体的策略搜索,经过少量专家排序即可获得满意的策略。