ICLRJun, 2021

低精度训练中的内存与误差权衡

TL;DR本文提出一种基于 Pareto 估计的技术 (Pareto Estimation to Pick the Perfect Precision,PEPPP),使用矩阵分解来查找非支配配置 (即 Pareto 前沿),以在有限数量的网络评估下找到最小化错误的精度,从而解决低精度算术训练深度学习模型中的超参数调节问题。