Jun, 2023

InRank: 增量低秩学习

TL;DR该研究提出了渐进式低秩学习技术,通过一个新的训练算法 InRank 来改进神经网络的训练,使得神经网络参数化后低秩化,以此提高计算效率并在 WikiText-103 上训练 GPT-Medium 模型时分别实现了 20% 的减少训练时间和 37% 的减少内存使用,同时保持了与全秩情况下相似的预测表现。