- 自专家的自我分化大型语言模型
我们提出了一种名为 Self-MoE 的方法,将一个整体的 LLM 转化为由自身专业化的专家模块组成的组合式模块系统 MiXSE。我们的方法利用自我专业化,使用自生成的合成数据构建专家模块,每个模块都配备了共享的基础 LLM,并融入了自我优 - 基于增强学习的实用高效量子电路综合与映射
通过使用强化学习方法,将其整合到量子传递工作流中,实现了量子电路的综合和路由优化,且在速度和优化的效果上明显超越其他方法,在实际的量子传递过程中显示出很高的实用性。
- 基于聚类的近似最大内积搜索中的乐观查询路由
本研究旨在研究基于聚类的最近邻搜索中路由问题,通过乐观主义的原则,利用内积分布的矩来乐观地估计最大内积,通过只使用前两个矩实现与现有算法相当准确度的搜索,并且所提出的算法在空间利用上也更为高效。
- ACL发挥多重智慧的力量:从 LLM 路由中所学到的经验
我们探讨了是否可以将每个输入查询直接路由到最合适的 LLM,我们的广泛实验表明这样的路由有前景但在所有情景下都不可行,因此应该研究更加稳健的方法来填补这一空白。
- 基于答案集编程的多智能体路径规划中的路由与调度:初步报告
我们提出了一种在答案集编程(ASP)中进行路由和调度的替代方法,并在多智能体路径规划的背景下进行了探索。这种方法捕捉了时间流的部分顺序而不是与行动和谓词相关联的时间步骤,终止了对计划长度的固定上界的需求。这种避免的代价是(部分)时间轨迹必须 - 分布式卫星路由的多主体深度强化学习
该研究介绍了一种用于低地球轨道卫星链路的多智能体深度强化学习方法(MA-DRL),通过融合全局深度神经网络以及本地预训练 DNN,实现离线学习最优路径并快速适应网络和流量变化,在线实现高效分布式路由。
- DBCopilot: 拓展自然语言查询至海量数据库
DBCopilot 是一个框架,通过使用紧凑且灵活的副驾驶模型,将 Text-to-SQL 过程分解为模式路由和 SQL 生成,为处理大规模模式提供了可扩展且有效的解决方案。
- 基于神经辐射场的智能多层次视图合成架构
通过提出的优化路由选择策略,使用红火蚁策略改进按需源路由系统,通过预测路由故障和能量利用来选择路径,评估结果表明该策略提高了网络生命周期,降低了节点能量消耗和端到端延迟。
- 自动引导车的高效在线调度和路径规划:基于环路算法与现有方法的比较
我们提出了一种基于循环的算法,用于解决自动引导车辆(AGV)的在线冲突自由调度和路径规划问题,并与精确方法、贪心启发式和元启发式进行比较。实验证明,该算法要么优于其他算法,要么在更短的计算时间内得到同样好的解。
- 无人机网络中基于强化学习的有意攻击路由恢复
该研究论文重点研究了受到攻击的无人机网络的路由方案和恢复问题,通过设计基于节点重要性的攻击模型和节点重要性排名机制,利用基于强化学习的智能算法来处理当无人机受到攻击时的路由路径恢复问题,并通过模拟实验验证了该机制优于其他参考方法。
- 拥堵预测的变分标签相关增强
基于变分推理的标签相关性增强拥塞预测方法(VAriational Label-Correlation Enhancement for Congestion Prediction),利用局部标签相关性优化了回归模型的性能,验证了其在大规模电路 - 自适应路由的专家软融合
本文提出了 Soft Merging of Experts with Adaptive Routing(SMEAR)算法,通过使用加权平均的单个合并专家,避免了离散路由,同时实现了标准梯度上升训练。 SEMENT 不仅不会增加计算成本,而且 - XRoute Environment:一种新型强化学习路由环境
本研究提出了 XRoute 环境,使用增强学习来提高现代设计自动化流程中关键的 Routing 阶段的质量和效率,在全芯片测试基准中报告了两种广泛使用的增强学习算法(PPO 和 DQN)和一种基于搜索的算法(TritonRoute)的基线结 - 技术人员路径规划和调度问题的增强迭代局部搜索
本文提出了一种增强的迭代局部搜索方法,解决了欧洲公共设施在维护和运营时遇到的人力调度问题,以降低维护成本并提高生产力。
- 基于数据驱动智能体模型的最优可扩展疏散规划
本研究针对灾难管理中的撤离规划问题,结合数学优化和启发式搜索,提出了可优化多种目标函数的规划方法 MIP-LNS 及其进化版 MIP-LNS-SIM,前者在限制时间内能够找到更优的方案,而后者结合基于代理模型的延误评估可同时达到高效的撤离规 - 多核弹性光网络中的资源分配:一种深度强化学习方法
本文首次将深度强化学习应用于动态多核光纤弹性光学网络中的路由、调制、波谱和核心分配问题,并通过与三种基线启发式方法的模拟进行了验证,表明该方法可以显著降低阻塞概率。
- EMVLight:应急车辆分散路由和交通信号控制系统的多智能体强化学习框架
本文提出了一种基于分散式强化学习的方法 (EMVLight),通过一种创新的 RL 代理人和一种新型的基于压力的奖励函数,该方法可以学习网络级合作交通信号相位策略,不仅可以减少急救车行车时间,还可以缩短其他车辆的行驶时间。通过模拟实验,证明 - MM面向成本和时延敏感的虚拟网络功能部署和路由的多智能体深度强化学习
本文提出了一种基于多智能体深度强化学习的有效而新颖的方法,用于解决联合虚拟网络功能(VNF)部署和路由问题,该问题涉及多个不同需求的服务请求同时交付,并通过其延迟和成本敏感因素反映服务请求的不同需求,提出了基于参数移植的模型重新训练方法来处 - 变形一维物体的高效空间表示和路径规划
本文提出了一种新的方法来路由可变形的一维物体,该方法基于将空间几何分解为凸子空间的方式进行空间表示,使用一种快速的动态规划序列匹配方法计算下一个路由移动,并将路由和高效配置耦合以提高规划时间。实验结果表明,该方法能够正确地计算下一个操纵动作 - 芯片设计中联合学习解决放置和路由问题
通过深度强化学习方法 DeepPlace 和 DeepPR,结合梯度优化和强化学习,编码输入宏单元的全局图层和本地节点层信息的多视图嵌入模型,并通过鼓励探索的随机网络蒸馏方法,有助于解决现代芯片设计过程中的放置和路由问题。