学习高效的多智体通信:信息瓶颈方法
本研究提出了一种门控机制来自适应地剪枝无用消息,使得在多智能体通信时,性能得到显著提升,同时在真实世界中的数据包路由任务和四个基准测试任务中,比现有的基于深度强化学习和基于规则的方法都表现良好。
Feb, 2019
本文研究了如何平衡效用、信息的有效性和复杂性,从而塑造新兴的通信,并将其与人类通信进行比较。我们使用 VQ-VIB 方法训练神经代理来压缩输入以获得离散信号,从而比以往的神经体系结构在其性能方面更具优越性,并发现惩罚交际复杂性可以维持高效用的同时维持类似人类的词汇量。此外,我们还发现,VQ-VIB 优于其他离散通信方法。
Jun, 2022
本文提出了一种基于学习的通信方案,综合优化特征提取,源编码和信道编码,采用变分信息瓶颈框架构建可行的上界,使用稀疏诱导分布作为变分先验,提高边缘设备和强大边缘服务器的传输性能和速度。
Feb, 2021
多智能体系统中的信息交流在部分可观察环境中提高智能体之间的合作,本文考虑了基于有限和不可靠信道下智能体的合作通信,通过提出一种基于独立 Q 学习的新型通信方法,智能体可以动态适应信息共享的量,从而根据本地观察和信道特性发送不同大小的消息,同时智能体学习编码和解码消息以提升共同训练的策略,在合作式数字预测环境中,我们展示了相比于没有自适应能力的方法,我们的方法表现更好,并讨论了其在交通路口环境中的局限性。
Nov, 2023
本研究提出了一种名为 SchedNet 的多智能体强化学习框架,其中智能体能够自主学习如何安排通讯、编码消息以及根据接收到的信息选择动作,并在合作通讯与导航以及捕猎等不同应用场景下展示了比其他机制更显著的表现差距,达到 32% 至 43% 的性能优势。
Feb, 2019
本文提出了一个框架,利用神经消息编码器来学习多智能体强化学习中的通信策略,包括消息传输时机、消息内容以及如何保留消息信息。模拟实际的无线网络环境下,与现有技术相比,该框架在游戏性能、收敛速度和通信效率方面都有显著提高。
Sep, 2022
本文提出了 Individualized Controlled Continuous Communication Model (IC3Net),在多智能体协作、半协作与竞争环境下,通过门控机制控制持续传输,并使用个性化奖励来提高性能和可扩展性,修正学分分配问题。实验结果证实,IC3Net 网络比基准网络在不同场景下具有更好的训练效率和收敛率,智能体基于场景和可盈利性学会如何传输信息。
Dec, 2018
本文提出了一种基于任务导向的通信方案以减少多设备合作边缘推理中的通信开销与延迟,并通过信息瓶颈原理提取与任务相关的特征并采用分布式信息瓶颈框架来对分散的特征进行编码。通过对多个设备传输的信息进行冗余性分析并采用可变近似来解决计算的复杂性问题,该方案比基线方法更好地平衡了传输效率与推理能力的关系。
Sep, 2021