Jul, 2023

PIMbot:多机器人强化学习在社会困境中的策略和激励调整

TL;DR本文介绍了一种名为PIMbot的新方法,通过策略操纵和激励操纵来操纵多机器人协作中的奖励函数,以探索多机器人通信如何实现不同结果,并展示了在Gazebo仿真多机器人环境中提出的方法的有效性。