May, 2023

使用参数对称性提高收敛和泛化性能

TL;DR研究发现,基于对称性变换的 teleportation 算法加速了优化,并提高了泛化性能。同时发现,在不同曲率下进行 teleporting 到 minima 有助于提高泛化性能。此外,在优化算法和基于优化的元学习中集成 teleportation 都能提高收敛性。