Jul, 2023

分区局部深度的顺序和共享内存并行算法

TL;DR我们设计、分析和优化基于分区本地深度(PaLD)的顺序和共享内存并行算法。通过对成对距离进行三元比较,我们设计了两种算法变体来执行社区结构分析。通过理论分析计算和通信成本,我们证明了顺序算法在通信上的最佳性能。我们介绍了性能优化策略,使得顺序实现相对于基线顺序实现加速高达29倍,并且在Intel多核CPU上使用32个线程时相对于优化顺序实现加速高达19.4倍。