Oct, 2023

自然语言处理的部分张量化变压器

TL;DR本研究利用张量列分解技术对 Transformer 视觉语言神经网络(BERT 和 ViT)进行压缩,从嵌入层压缩和神经网络的部分张量化两方面进行,提高了现有模型的准确性,无需后训练调整。