Aug, 2023

基于多智能体强化学习的连续通信消息编码技术的可扩展性

TL;DR通过多智能体加强学习技术学习通讯协议和行动协议,智能体们能够决定共享哪些信息,并通过文中的实验证明,智能体们使用平均信息编码器,并结合指数和对数函数的组合来避免应用平均信息编码器后的重要信息丢失。