- 能源网络的多智能体强化学习:计算挑战、进展与开放问题
电网架构和功能的快速变化以及可再生能源和分布式能源资源的不断增长导致了各种技术和管理挑战。本调研报告探讨了多智能体强化学习(MARL)如何支持能源网络的去中心化和脱碳,并缓解相关的挑战。通过指定管理能源网络中的关键计算挑战,回顾最新的研究进 - De-DSI: 分散可微搜索索引
De-DSI 是一种新颖的框架,通过将大型语言模型(LLMs)与信息检索真正的分布式化相结合,特别是在分布式环境中采用可微分搜索索引(DSI)的概念,以有效地将新颖的用户查询与文档标识符连接起来,在仅使用查询 - 文档标识符对上进行操作。该 - 去中心化合作驾驶的单智能体演员评论算法
通过引入一种新型的非对称的演员 - 评论家模型,采用单智能体强化学习来学习分散协作驾驶策略,利用掩码的注意神经网络处理实际交通流的动态特性和部分可观测性,我们的模型在不同交通情景中表现出提高道路系统中各个瓶颈位置交通流的巨大潜力,并且通过探 - 区块链联邦学习中分权化的含义:评估模型过期和不一致性的影响
本文研究了将 FL 的协调工作外包到区块链等民主网络中所造成的模型陈旧和不一致对异步设备训练过程的影响,并通过仿真评估了区块链的 FL 运作在著名的 CIFAR-10 数据集上的准确性和及时性。结果表明,模型不一致对模型的准确性有很大影响( - 人工智能与民主的数字身份危机
人工智能工具可以帮助少数人运行规模空前的虚假信息宣传活动。隐私保护身份证明可以大大减少身份冒用并易于识别和阻止虚假信息。通过了解身份证明在去中心化范围内的定位,我们可以更好地理解各种身份证明的成本和收益。本文讨论了各种身份证明类型,包括政府 - 区块链上使用 UBET 自动做市商进行体育博彩
该论文介绍了在去中心化的体育博彩中通过自动化做市商 UBET AMM (UAMM) 利用智能合约和算法公平定价体育赔率的方法,建立了一个链上博彩框架,该框架确保流动性、去中心化定价和全球可访问性,从而促进了无信任和高效博彩。
- 自适应多智能体多臂赌博机的大规模电动汽车去中心化智能充电
提出了一种基于自适应多智能体系统哲学的完全去中心化智能充电系统,利用多臂赌博学习来处理系统中的不确定性,并考虑了不同参与者的公平性,通过详细案例研究进行了性能评估。
- 微电网能量管理的多目标强化学习框架
本文提出了一种新颖的多目标强化学习框架,可以探索高维的目标空间并发现冲突目标之间的权衡,该框架利用强化学习的数据驱动特性,可在不需要长期预测或对根本不确定性的了解的情况下进行参数化政策的训练,用于 Cornell 大学微电网(CU-MG)的 - 复杂机器人系统的分散式动作技能学习
提出去中心化马达技巧(DEMOS)学习算法,改进了基于单个神经网络的强化学习控制器对任务的高度依赖性,并且在保持性能的同时提高了策略的鲁棒性和泛化能力。该算法通过自动发现可分离的马达群组并学习分散控制策略,可以在四足和人形机器人上实现。
- FLAGS 框架用于联邦学习算法的比较分析
该论文通过多个操作条件的综合交叉评估来分析主要的联邦学习算法,重点关注泛在的分散结构和中央汇聚方法,并研究了多种聚合策略的效果。研究表明,完全分散的联邦学习算法在多个操作条件下实现了可比较的准确性,且具有更高的本地更新速率和更好的噪声环境操 - 加密货币交易对的最佳设置
加密货币交易对最优化问题的解决方法:使用基于正则化截断特征值分解的方法填补缺失值,然后使用启发式搜索和修剪策略的分支限界过程来搜索最优交易对,实验结果显示应在交易对数量、涵盖面与频繁调整间权衡取得合适平衡。
- 多机器人场景中去中心化联邦强化学习
本文提出了一种基于移动代理的方法,在 Webots 中用 Tartarus 来去中心化联邦学习,实现在连接机器人的情况下的去中心化联邦增强学习(dFRL),在基于 Q 学习和 SARSA 的实验中,通过聚集它们对应的 Q 表,证明了在机器人 - 基于交替客户端的医学图像联邦学习性能和可扩展性研究
本文介绍了关于联邦学习的理论方面,提出了一个聚合算子和不同类型的联邦学习,针对客户端数据分布要考虑的问题进行了详尽的分析,并提出了胸部 X 光图像分析的使用案例。针对训练数据中的不同客户端进行了模拟,并考虑了中断客户端所带来的不同问题及其解 - 基于区块链的异步联邦学习的去中心化
本研究使用一款模拟工具,研究了使用区块链技术达到去中心化的联邦学习(FLchain)所带来的影响,并探究了信息时效性和账本不一致性这两点对 FL 性能的影响。
- ICLR加强子社区:实现人工智能研究的可持续增长
提出将同行评审和出版流程重新分散的建议,以促进每个子领域解决与学术出版和激励机制有关的问题。
- 资源感知的分布式次模型最大化:多机器人决策制定的范例
本研究介绍了第一个算法,使得多个机器人可以选择与少数其他机器人协调,并能够在中央集权和去中心化协调之间平衡权衡,从而实现高效有效的多机器人决策制定,而不必考虑机器人的资源限制或任务复杂度。为了提供封闭形式保证,本文关注于涵盖单调和 “双重” - 机器人团队的分布式强化学习:回顾
本文总结了分布式无模型多智能体强化学习在多机器人协作中面临的挑战以及现有的解决方案类别,并介绍了基准测试和机器人应用,同时讨论了当前的研究方向。
- WSDMPipAttack:对联邦推荐系统进行投毒攻击以操纵商品推广
为了针对去中心化推荐系统中的局部模型投毒攻击,本文提出了一种系统性的方法来利用数据驱动推荐系统中固有的流行度偏差,实现针对特定项目的推广攻击。通过上传精心制作的梯度,在模型更新期间通过少数恶意用户有效地增加目标(不受欢迎)项目在结果联合推荐 - BE-RAN:区块链启用的具有去中心化身份管理和隐私保护通信的开放式 RAN
本文提出了基于区块链的无线接入网络(BE-RAN), 实现超低延迟和弹性按需服务,提供安全、私密的身份认证和管理,通过去中心化实现更好的操作模式和点对点通信,以及通过有效的隐私保护方法提高通信效率。
- 区块链辅助分布式联邦学习(BLADE-FL):性能分析和资源分配
提出了一种区块链辅助的去中心化联邦学习(BLADE-FL)框架,以解决标准 FL 在模型聚合方面存在的问题,并探讨了懒客户对学习性能的影响及优化方法。