基于图处理器的束调整

CVPRMar, 2020

Bundle Adjustment on a Graph Processor

Joseph Ortiz, Mark Pupilli, Stefan Leutenegger, Andrew J. Davison

TL;DR本文研究了基于 Graphcore 智能处理单元（IPU）的图处理器，证明了用高斯置信传播算法可以极快地解决经典计算机视觉问题中的束调整问题，并表明图处理的真正优势在于处理表示空间 AI 问题的一般动态因子图的灵活本地优化。

Abstract

graph processors such as Graphcore's Intelligence Processing Unit (ipu) are part of the major new wave of novel computer architecture for AI, and have a general design with massively parallel computation, distrib

graph processors ipu bundle adjustment gaussian belief propagation spatial ai

发现论文，激发创造

深度关注信念传播：融合推理与学习以解决约束优化问题

通过将 Belief Propagation、门控循环单元和图注意力网络无缝地整合进消息传递框架中，我们提出了一种名为 DABP 的深度注意力置信传播模型，它可以推断得到优化后的权重和阻尼因子，通过无需昂贵的训练标签，可有效避免常见的分布问题进行自我监督学习，并通过实验表明它显著优于现有的基线模型。

Sep, 2022

BAA-NGP: 捆绑调整加速神经图形基元

本文提出了一种基于加速采样和哈希编码的框架 BAA-NGP，它能够加快位姿估计、场景重建和新视角合成的处理速度，并在不降低位姿估计质量的情况下，比其他基于束调整的神经辐射场方法提高了十倍至二十倍的速度。

Jun, 2023

MegBA：基于 GPU 的大规模束调整分布式库

本文介绍了 MegBA—— 一种基于 GPU 的分布式大规模相机捆绑优化库，相较于目前现有的 Ceres、RootBA 和 DeepLM 等大规模相机捆绑优化库，它在一些大规模测试中表现出了更高的性能，可以提供巨大的聚合内存，可以自动划分大的 BA 问题，并将子问题的求解器分配到并行节点上。

Dec, 2021

迁移机器学习模型至智能处理单元的洞察

通过探索 Intelligence Processing Units (IPUs) 的优化技巧以及将专用模型迁移到 IPU 平台，本研究表明 IPU 是机器学习、材料科学和电池研究领域中 GPU 的一种可行加速器替代方案。在多次充放电循环中，本研究还展示了 IPU 上进行有效电导率预测任务时使用卷积神经网络 (CNN) 架构模型与 GPU 执行相当的性能，并通过基准测试发现 Graphcore 的 Bow IPU 相较于 Colossus IPU 有显著的性能改善。

Apr, 2024

通过微基准测试解剖 Graphcore IPU 架构

本文介绍了新型、大规模并行平台 —— 智能处理单元（IPU）的架构和性能，并使用受其目的所驱动的微基准测试来剖析 IPU 的性能行为，同时研究了 IPU 的内存组织和性能、芯片内部和外部互连提供的延迟和带宽、计算能力以及与理论极限相比的实际性能表现，旨在为读者提供简单的心理模型，以便根据涉及的计算和通信步骤来预测应用程序在 IPU 上的性能。

Dec, 2019

置信传播计数

本文介绍了一种名为计数 BP 的新型 BP 算法，它利用了图模型中存在的对称性，通过构建压缩图模型的方式实现更高效的模型推理，在包括动态关系模型和布尔模型计数等多种人工智能任务中取得显著的效率提升。

May, 2012

利用蝴蝶分解减少 IPU 的内存需求

高性能计算从硬件平台的不断改进中受益，在保持合理功耗的同时提供更多的处理能力。智能处理单元（IPU）是一种新型的大规模并行处理器，旨在加速具有大量处理核心和高速内存组件的并行计算。本文研究了如何在 IPU 上实现蝶形结构，并研究了它们与 GPU 的行为和性能的比较。实验结果表明，这些方法可以提供 98.5% 的压缩比，减少对内存的极度需求。在蝶形和像素化蝶形方面，IPU 的实现可以获得 1.3 倍和 1.6 倍的性能改进。我们还在 CIFAR10 等实际数据集上实现了 1.62 倍的训练时间加速。

Sep, 2023

高斯信念传播：理论与应用

使用高斯信仰传递算法（GaBP）解决线性方程组问题，实现了迭代解法，从而实现了分布式消息传递实现解决方案的算法。通过广泛的模拟实验，在具有数百万节点和数亿通信链接的真实网络拓扑上展示了 GaBP 算法的吸引力和适用性。

Nov, 2008

高速并行贝叶斯网络结构学习

本文提出了一种基于多核 CPU 的快速解决方案 Fast-BNS，用于加速贝叶斯网络结构学习，通过动态工作池设计、CI 测试分组、缓存友好数据存储和实时生成条件集等优化措施，实现了对处理时间和内存使用的有效控制，并在综合实验研究中证明了其相对于当前多线程技术的显著加速效果。

Dec, 2022

高斯置信度传播下的多机器人协作规划分配

本文提出了一种基于高斯信念传播的分布式技术 GBP Planning，用于解决多机器人规划问题，该方法可以在复杂的场景中实现高效的协作规划并保持短、快速、平滑的轨迹。

Mar, 2022