多智能体强化学习中的化学趋化策略的出现

Apr, 2024

多智能体强化学习中的化学趋化策略的出现

Emergence of Chemotactic Strategies with Multi-Agent Reinforcement Learning

Samuel Tovey, Christoph Lohrmann, Christian Holm

TL;DR探究强化学习在生物系统中的应用，以了解智能体的信息处理方式，研究其在趋化性游动中的应用和策略。

Abstract

reinforcement learning (RL) is a flexible and efficient method for programming micro-robots in complex environments. Here we investigate whether reinforcement learning can provide insights into →

reinforcement learning chemotaxis biological systems agent size swim speeds

发现论文，激发创造

通过强化学习实现智能微游动物的流体导航

本文介绍了如何利用强化学习算法设计智能的微型游泳机器人，实现在复杂液体环境下的自主适应行为与最优策略的学习。

Jan, 2017

海胆精子的趋化运动通过深度强化学习实现

研究模仿海胆精子细胞的化感运动模型，利用人工神经网络作为决策代理，通过深度强化学习算法实现微型机器人的智能机动，在有限的环境信息下，发现比人类设计更有效的运动策略，并利用外部扰动促进化感运动。

Aug, 2022

微观尺度下环境对多智能体强化学习紧急策略的影响

本文采用 Langevin 分子动力学模拟，探究了温度在微观环境下多智能体强化学习中策略出现及有效性方面的影响，发现在高温下智能体能够发现新的任务完成策略，并介绍了一个用于研究微观智能体强化学习的 Python 包。

Jul, 2023

利用强化学习导航微型机器人群体以进行定向输送

本研究使用强化学习算法 (PPO 和 RPO) 来控制微型机器人群在水力影响下到达目标。研究表明课程学习可以提高性能，并展示了在控制 25 个游泳器协同机动方面 RL 模型的能力。

Jun, 2023

智能磁性微机器人通过深度强化学习学会游泳

研究开发出了智能螺旋状磁性水凝胶微型机器人，并通过深度强化学习算法自主推导出控制策略，使其在未经表征的仿生流体环境下受控于三维电磁铁阵列产生的变时磁场游泳。

Jan, 2022

在复杂环境中产生运动行为

本文研究增强学习中环境对复杂行为的促进作用，通过在多个不同环境下训练代理人，使用基于前进步伐的简单奖励函数，利用可扩展的策略梯度强化学习方法，代理人可以学会奔跑、跳跃、蹲下和转弯等复杂行为而无需明确的基于奖励的指导。

Jul, 2017

适应不同觅食环境的人工学习智能体群行为发展

应用投影模拟和强化学习方法研究了人工智能智能体在收集资源过程中不同集体运动模式和个体运动趋势

Apr, 2020

学习噪声趋化中空间和时间信息的最优集成

本研究通过深度强化学习方法，研究了在化学趋向作用中由空间梯度估计和时间梯度估计驱动的边界，并发现混合化学趋向策略在小细胞和大细胞之间的过渡是连续的，并且在过渡区域，混合化学趋向策略优于具有约束性的变体以及明确整合空间和时间信息的模型。

Oct, 2023

通过深度强化学习探究 Morris 水迷宫中的导航策略

本研究使用 2D 模拟 Morris 水迷宫来训练深度强化学习代理程序，并自动分类了导航策略，将人工智能的学习动力学与动物实验数据进行比较。通过开发环境特定的辅助任务来研究影响其有用性的因素，最后研究了人工代理神经网络中激活的内部表征的发展，这些表征类似于老鼠大脑中发现的 place cells 和 head-direction cells，并且它们的存在与人工代理采用的导航策略有相关性。

Jun, 2023

多智能体竞争引发的紧急复杂性

本文介绍了几种在三维环境中进行竞争多智能体自我对抗训练的方法，这些方法可以训练出丰富多彩、技能复杂的智能体。此外，我们指出，自我对抗训练可以产生超出环境本身复杂性的行为，并且自带课程设置，有助于智能体学习不同难度水平下的技能。

Oct, 2017