Jul, 2023

对比学习用于学习通信

TL;DR本文提出了通过对比学习优化多个 agent RL 中的通信策略,并在必要的任务环境中实现了更正确,更快速的通信和更全局的状态信息的提取。