Aug, 2023

Maestro: 通过可训练分解揭示低秩结构

TL;DR设计高效的低秩模型,通过一种广义的 Ordered Dropout 方法将低秩结构内嵌到训练过程中,实现对深度神经网络进行可训练的低秩层插入,从而提取出足够小的模型,保持模型性能并允许在不同性能设备上进行准确性和延迟的权衡。