Apr, 2016

分布式计算中计算和通信之间的根本权衡

TL;DR本论文研究的问题是如何在分布式计算中,通过优化计算负载来降低通信负载,通过研究分布式计算中计算和通信之间的权衡关系,提出一种编码方案,命名为 “编码分布式计算”(CDC),该方案通过增加 Map 函数的计算负载来减少通信负载,实现了计算和通信的最优权衡。同时,将 CDC 的编码技术应用于 Hadoop TeraSort 基准测试中,开发出一种新的编码 TeraSort 算法,对实验中最常用的设置进行了验证,整个作业执行速度提高了 1.97 至 3.39 倍。