Mar, 2012

关于压群算法和条件梯度算法之间的等价性

TL;DR本文研究了 Welling(2009)的聚集过程,发现其采用标准的凸优化算法,即条件渐近算法,通过最小化二次矩差异。通过数值模拟研究了不同变体的行为。结果表明,虽然我们可以在近似积分的任务上对 herding 进行改进,但原始的 herding 算法更倾向于接近最大熵分布,揭示了 herding 背后的学习偏差。