BriefGPT.xyz
大模型
Ask
alpha
关键词
matrix product operator
搜索结果 - 3
学习有限相关状态:谱重构的稳定性
可以用大小受控制的边际重构出一种矩阵乘积算子,并证明了针对 C*- 有限相关的状态可以获得一个更精确的误差界,此外还可以应用于其他有趣状态的竞争性算法。
PDF
7 months ago
预训练语言模型的参数高效专家混合架构
本文提出了一种参数高效的混合专家架构,通过在专家层中共享参数矩阵中心张量的信息,并通过辅助张量增加各个专家的特异性,从而通过矩阵乘积算子来实现受量子多体物理学影响的张量分解,以解决混合专家架构中存在的参数膨胀问题,实验结果表明新方法具有更好
→
PDF
2 years ago
ACL
基于矩阵积算子的预训练语言模型压缩的轻量级微调
提出了一种基于量子多体物理中的矩阵积算符(简称 MPO)的新型预训练语言模型压缩方法,其可以将原始的矩阵分解成中心张量和辅助张量,通过仅更新辅助张量的参数进行微调并为 MPO 结构设计优化算法,可应用于原始或压缩的语言模型以实现更轻量级的网
→
PDF
3 years ago
Prev
Next