Apr, 2011

矩阵和数据的随机算法

TL;DR本文详细介绍了随机矩阵算法理论的最新进展以及这些思想在大规模数据分析实际问题求解中的应用,重点放在一些简单的核心思想上,这些思想不仅支撑了最近的理论发展,也使得这些工具在大规模数据应用中非常有用;本文特别关注了统计上的杠杆作用这一概念,它不仅可以用于识别异常值,而且还可以帮助开发更好的矩阵算法,这些方法可以解决诸如线性最小二乘问题和低秩矩阵逼近问题。与之前最佳确定性算法相比,最终得到的随机算法的最坏运行时间渐近更快;它们的数值实现在时间上更快;或者它们可以在现有数值算法无法运行的并行计算环境中运行。