- 高效并行多跳推理:知识图分析的可扩展方法
这篇论文重点关注如何优化多跳推理(MHR)的时间效率,提出了一种新的并行算法来快速识别知识图谱中顶点之间的前 K 个路径,从而有效地回答三跳查询,并通过实证结果展示了该算法的卓越性能。
- 并行随机凸优化中的计算 - 查询深度缩小
我们开发了一种新的并行算法,用于最小化具有随机次梯度子序列的 Lipschitz 函数。与现有的先进交互式查询次数和查询深度相匹配的同时,在精度足够小时通过多项式因子改进了计算深度。结合之前现有的最先进方法,我们的结果填补了并行算法的已知最 - PANDORA:单链接聚类的并行树状图构建算法在 GPU 上的应用
本研究提出了一种针对单链接层次聚类(包括 hdbscan)高效构建树状图的新型并行算法 pandora,通过独特的递归树合并方法以及支持 GPU 加速的实现,使 pandora 在处理实际数据中的倾斜树时无需考虑渐进性工作最优,相较于目前最 - 通过自组织高斯网格实现紧凑的三维场景表示
我们提出了一种紧凑的场景表示方法,将三维高斯扩散模型的参数组织成具有局部均匀性的二维网格,从而实现了存储需求的大幅度降低,同时在渲染过程中不影响视觉质量。
- 一种基于加权 K-Center 算法的数据子集选择
基于深度学习的子集选择方法,通过结合高不确定性的边缘采样和多样性聚类方法的加权和来计算子集,并通过并行算法在大数据集上取得了类似或更好的性能表现。
- 权值共享正则化
通过引入 'weight-sharing regularization' 为神经网络定义了目标函数,并研究了其近端映射,同时介绍了解释为相互作用粒子的物理系统观点。基于该观点,设计了一种新的并行算法用于近端映射,相较于之前的算法具有指数级加 - 对序列长度进行非线性顺序模型的并行化
通过并行算法提高 GPU 评估顺序模型的速度,解决传统顺序模型训练速度缓慢的问题,加快训练速度同时保持输出准确性,使得非线性顺序模型在长序列问题中具备潜力。
- 一种新颖的张量专家混合并行方法用于规模化专家混合训练
本文提出一种新的混合专家神经网络架构(MoE),并采用三维混合并行算法,结合张量、专家和数据并行,进行内存和通信优化,极大地提高了 MoE 模型的训练效率和精度。
- 并行数值方法精度、收敛性和可复现性的高效求和算法
我们介绍了一种新的并行算法,该算法通过优先计算相同指数的数字来减轻浮点算数中误差问题,并通过精度、收敛性和可重现性等性质的广泛分析来验证其有效性。我们还选择了 Simpson,Jacobi,LU 因数分解和迭代幂法等代表性数值方法来展示算法 - MM大规模 Tractography 数据集的纤维束分割并行优化
本文提出了一种基于多学科纤维捆束图谱的优化算法,实现了自动分类白质纤维的功能。新算法通过并行处理和本地内存的利用对旧版算法进行了优化,能够更快速地分析更大规模的数据集,从而提高了处理速度和降低了内存占用率。
- NIPS可扩展的拉普拉斯 K-modes
我们提出了一种新的算法 Laplacian K-modes,并通过优化一个紧密的辅助函数提高了其可伸缩性,进而实现了大规模数据的并行化聚类和密度模式查找,并在各种数据集上进行了全面的实验。
- 并行下考虑拟阵约束和装箱限制的子模块最大化
本文提出了一种在单个 matroid 约束或多个 packing 约束下,通过小量自适应查询轮次来最大化 submodular 函数的多线性扩展的算法,该算法在 submodular maximization with a matroid - 高斯过程的尴尬并行推断
该研究使用混合专家模型代替传统高斯模型,在降低计算成本的同时,提高了模型的弹性和可伸缩性。
- ZNN - 一个快速可扩展的算法,用于在多核和众核共享内存机器上训练 3D 卷积网络
本研究介绍了一种基于任务分解的并行算法 ZNN,它能够在计算机视觉中应用广泛的卷积神经网络中实现 PRAM 模型下的线性加速,通过时间局部化和一种几乎无等待的并发方法,此算法能够在共享内存机器上达到与物理核心数量相当的加速效果,适用于宽网络 - 大规模复杂网络着色
提出一种基于 egonet 属性和并行算法的大规模复杂网络图染色方法,几乎在所有网络中都显示出优异的性能,并获得近乎最优解。
- ICML高斯过程赌博优化中的勘探 - 开发权衡并行化
该论文研究了如何在贝叶斯全局优化中利用并行算法解决多臂赌博问题,提出了基于高斯过程的 GP-BUCB 算法,证明了与串行方法相比,该算法的累积遗憾仅增加一个独立于批量的常数因子,并在两个真实世界应用中展示了其有效性。