May, 2024

QuadraNet V2:高阶神经网络的高效可持续训练与二次适应

TL;DR介绍了一种利用二次神经网络创建高阶学习模型的新框架 QuadraNet V2,通过利用预训练的权重来减少训练所需 GPU 时间,同时提高了信息表征能力。