- 基于聚类调度的多目标云多工作流公平优化
该篇论文提出一种基于 makespan、cost 和 fairness 的多目标优化模型和全局聚类多工作流调度策略用于资源分配,实验结果表明该方法在维持整体 makespan 和 cost 的同时也达到了个体公平性,可为云上模拟工作流调度提 - ADDAI:分布式人工智能的异常检测
本文提出了 ADDAI:一种分布式人工智能异常检测技术,旨在解决物联网(IoT)和工业物联网(IIoT)中大规模数据传输和系统高速运行的挑战,具有高速、鲁棒性、低通信开销、隐私保护和可扩展性等优点。该技术可减少工业物联网传感器数据上传到云端 - 边缘智能加速元宇宙发展:元宇宙与移动边缘计算的融合
本研究提出了一种雾边混合计算架构,利用边缘设备计算能力来执行与 Metaverse 实体相关的计算成本,以减少 Metaverse 应用程序基于云的计算模式的延迟,并证明了实验结果可以将延迟降低 50%。
- CVPRBigDL 2.0:从笔记本电脑到分布式集群的 AI 流水线无缝扩展
BigDL 2.0 是一个开源项目,可以有效帮助数据科学家从单个笔记本电脑上加速 AI 项目并扩展到大规模分布式计算集群,该项目已在 Mastercard、Burger King、Inspur 等公司的生产中得到应用。
- WawPart: 知识图谱的工作负载感知分区
本研究提出了一种基于查询工作负载的知识图谱分区方法,通过聚类查询和重写查询来减少分布式关联并优化工作负载性能。实验结果表明了该方法在工作负载处理时间上的性能提高。
- FLHub: 一种联邦学习模型分享服务
本研究提出了一个名为 Federated Learning Hub(FLHub)的联邦学习模型共享服务,用户可以上传、下载、贡献由其他开发者开发的模型,类似于 GitHub。我们证明,分叉的模型比现有模型更快地完成了训练,并且每个联邦循环的 - Alpa:分布式深度学习的操作员内部和操作员间并行性自动化
Alpa 是一个自动化生成深度学习(DL)大型模型的模型并行训练执行计划的系统,它利用数据、算子和流水线并行性来生成执行计划,实现了两个层次的并行性:算子内和算子间,并且通过编译器的优化自动得出高效的并行执行计划,并在分布式计算设备上进行了 - 基于代理的分布式群体优化算法在计算代价昂贵模型中的应用
本论文旨在在并行计算结构中实现基于代理的适应度评估,在复杂的地质科学景观进化模型上实现优化解决方案时间的缩短,同时保持优化准确性。
- 具有理论保证的压缩通信分布式求解变分不等式方法
本文介绍了使用压缩通信解决变分不等式和鞍点问题的分布式方法:MASHA1 和 MASHA2,并通过两个实验验证了结论的正确性。
- ICMLDG-LMC:一种易于使用且可扩展的同步分布式 MCMC 算法,其中采用 Gibbs 内的 Langevin Monte Carlo
本文提出了一种可靠性高、计算效率高的分布式 MCMC 算法来处理分布式数据集,该算法在高维环境下证明具有可伸缩性,并通过合成和真实数据的实验验证了方法的重要性。
- CoEdge: 基於異構邊緣設備的自適應工作負載分配合作式 DNN 推論
本研究提出一种名为 CoEdge 的分布式深度神经网络计算系统,优化了边缘设备的计算和通信资源,在许多共同参与的异构边缘设备上进行协同深度神经网络计算,与现有方法相比,CoEdge 在降低能耗方面更具优势。
- 分散式有限和优化的最优算法
本文提出了一种名为 ADFS 的高效分布式算法,利用局部碰撞更新和节点之间的分布式通信,在单机上运行时比现代加速随机算法要慢,但在 n 个机器上最小化目标函数与在一个机器上 m 个样本的最优算法相同的时间内完成。我们证明了 ADFS 是分散 - ICML基于本地幂迭代的高效分布式奇异值分解
本文研究了分布式计算截断奇异值分解问题的算法,提出了一种称为 LocalPower 的改进通信效率的算法,并且在实验中证明了其有效性。
- 用于高速流式主成分分析的分布式随机算法
本文探讨了在流式数据下,从独立同分布的数据采样中估算协方差矩阵的主特征向量的问题,并提出和分析了一种分布式变体方案 D-Krasulina,该方案可以在多个处理节点上分布计算负载以跟上高数据流率。通过对该方案的分析表明,在适当的条件下,D- - 多智能体多臂赌博机中的社交学习
介绍了一个分布式算法来解决多臂赌博机问题,通过异步交换较少的比特数,在不进行样本交换的情况下,仅通过传递臂 ID 来维护代理之间的合作;文中提出的算法可以将每个代理的后悔最小化,并将通信复杂度降至 $O (logT)$,与不进行合作的方案相 - 在分布式异步环境下调控动量
提出了一种名为 DANA 的技术,旨在解决分布式异步训练的梯度走样问题,可以加速深度神经网络的训练过程且不影响最终精度。该方法在 CIFAR 和 ImageNet 数据集上表现出比现有方法更好的性能。
- ICLR图神经网络无法学习的内容:深度与宽度
该论文研究了图神经网络的表达能力,发现了其在深度和宽度受限时可能会失去很大一部分功效,同时提出了一种使分布式计算的经典结果得以重用的新技术,给出了各种图论问题的下界。
- RDMA 对协议的影响
通过研究远程直接内存访问技术在实现共识方面的应用,本文发现 RDMA 技术可以改善分布式计算中容错和性能之间的固有平衡问题,提出了一些只需要基本的网络延迟就可以实现高容错和高性能的算法。
- 无线边缘计算与延迟和可靠性保证
该文章介绍了边缘计算的概念和其在 5G 无线系统和关键应用领域的重要性,讨论了需要提供的计算和决策服务以及相关挑战,并探索了几个关键案例和未来的前景。
- AutoCross: 用于实际应用程序的表格数据自动特征交叉
本文介绍了 4Paradigm 开发的自动特征交叉工具 AutoCross,通过树形空间的束搜索,实现高阶交叉特征的高效生成。同时,提出了连续的小批量梯度下降和多粒度离散化等算法来进一步提高效率和有效性,旨在减少分布式计算中涉及的计算、传输