多智能体强化学习中的化学趋化策略的出现
研究模仿海胆精子细胞的化感运动模型,利用人工神经网络作为决策代理,通过深度强化学习算法实现微型机器人的智能机动,在有限的环境信息下,发现比人类设计更有效的运动策略,并利用外部扰动促进化感运动。
Aug, 2022
本文采用 Langevin 分子动力学模拟,探究了温度在微观环境下多智能体强化学习中策略出现及有效性方面的影响,发现在高温下智能体能够发现新的任务完成策略,并介绍了一个用于研究微观智能体强化学习的 Python 包。
Jul, 2023
本研究使用强化学习算法 (PPO 和 RPO) 来控制微型机器人群在水力影响下到达目标。研究表明课程学习可以提高性能,并展示了在控制 25 个游泳器协同机动方面 RL 模型的能力。
Jun, 2023
研究开发出了智能螺旋状磁性水凝胶微型机器人,并通过深度强化学习算法自主推导出控制策略,使其在未经表征的仿生流体环境下受控于三维电磁铁阵列产生的变时磁场游泳。
Jan, 2022
本文研究增强学习中环境对复杂行为的促进作用,通过在多个不同环境下训练代理人,使用基于前进步伐的简单奖励函数,利用可扩展的策略梯度强化学习方法,代理人可以学会奔跑、跳跃、蹲下和转弯等复杂行为而无需明确的基于奖励的指导。
Jul, 2017
本研究通过深度强化学习方法,研究了在化学趋向作用中由空间梯度估计和时间梯度估计驱动的边界,并发现混合化学趋向策略在小细胞和大细胞之间的过渡是连续的,并且在过渡区域,混合化学趋向策略优于具有约束性的变体以及明确整合空间和时间信息的模型。
Oct, 2023
本研究使用 2D 模拟 Morris 水迷宫来训练深度强化学习代理程序,并自动分类了导航策略, 将人工智能的学习动力学与动物实验数据进行比较。通过开发环境特定的辅助任务来研究影响其有用性的因素, 最后研究了人工代理神经网络中激活的内部表征的发展,这些表征类似于老鼠大脑中发现的 place cells 和 head-direction cells,并且它们的存在与人工代理采用的导航策略有相关性。
Jun, 2023
本文介绍了几种在三维环境中进行竞争多智能体自我对抗训练的方法,这些方法可以训练出丰富多彩、技能复杂的智能体。此外,我们指出,自我对抗训练可以产生超出环境本身复杂性的行为,并且自带课程设置,有助于智能体学习不同难度水平下的技能。
Oct, 2017