- 分布式机器学习调查
本文介绍机器学习技术的发展以及为了应对更加复杂的应用而需要分布式系统来分担机器学习的工作负担,但分布式系统带来的挑战在于高效地并行训练过程和创建一个连贯的模型。文中提供了分布式机器学习领域当前的最新进展和系统概述。
- 分布式深度卷积神经网络用于物联网
本文提出了一种设计方法,旨在分配在分布式 IoT 应用程序中卷积神经网络(CNNs)的执行。该方法在满足单元级内存和处理负载的约束条件下最小化数据采集阶段和随后的决策阶段之间的延迟。该方法支持多个数据源和多个 CNN 的执行,从而可以设计基 - 联邦多任务学习
本文研究了在分布式设备网络上训练机器学习模型所面临的统计和系统挑战,提出了一种适用于多任务学习的优化方法 MOCHA,并在考虑通信成本、慢设备和容错性等实际系统问题的前提下,实现了比替代方法更显著的加速效果。
- 大规模分布式系统中的最优服务弹性
本文提出一种联合自动扩展和负载均衡方案,不需要任何全局队列长度信息或系统参数的显式知识,并提供可证明近似最优的服务弹性,同时分布式地进行操作并仅涉及每个任务的常量通信开销,从而确保在大规模数据中心操作中具有可扩展性。
- 混沌工程
介绍了一种名为混沌工程的方法,是通过实验来验证分布式系统的可靠性,适用于各种规模的科技组织。
- NIPS带有陈旧梯度的随机梯度 MCMC
在 SG-MCMC 中使用过期参数进行随机梯度计算在收敛性方面影响未知,但我们的理论表明,这仅影响偏差和均方误差,而估计方差与流逝度无关,在分布式系统中有一定的可扩展性和线性加速减少方差。
- Splash: 为并行化随机算法提供用户友好的编程接口
本文提出了一个称为 Splash 的通用框架,用于在多节点分布式系统上并行化随机算法,该框架以编程接口和执行引擎组成。在实现中,我们提供了关于并行化随机梯度下降的最优收敛率的理论论述。实验结果表明,Splash 相对于单线程随机算法和 Sp - 冗余请求何时会降低延迟?
研究冗余请求的延迟性能,旨在确定在什么情况下发送冗余请求有助于减少延迟,以及设计最优的请求冗余策略。
- 持久同调的分布式计算
本文介绍了一种简单的分布式算法,可以对持久同调进行并行计算,以捕获数据的拓扑特征,并且可以在多个节点上处理大型数据集。
- 分布式系统中的健壮概率推断
本文研究了概率推断问题在分布式系统中的应用,提出了一种新的基于消息传递的算法,相较于传统的 sum-product 算法,该算法对节点故障和通信失效有更好的稳健性,且在网络拓扑复杂时具有更优的计算复杂度,并用传感器网络定标任务进行了实验验证 - 指数随机图模型采样一致性
研究网络结构的统计模型中,针对采样亚网络应用整个网络模型来估计参数假设模型在采样下一致,但实际上这个假设会严重限制模型的表达能力,本文针对流行的指数随机图模型进行了讨论并提出了一些可行性条件和可能的解决方法。
- 分布式环境中的知识和共识
该研究为分布式系统中知识的形式化和推理提供了一个通用框架。它介绍了处理分布式知识状态的概念,包括分布式知识和常见知识,并阐明了常见知识与分布式系统中多种理想行为之间的关系。它还介绍和研究了许多有趣情况下可达到的常见知识的弱化变种。