BriefGPT.xyz
大模型
Ask
alpha
关键词
low-rank properties
搜索结果 - 2
U 型 Transformer:在时间序列分析中保留高频上下文
时间序列预测是各个工业领域中的关键任务。近年来,具备变换器骨干的神经网络在计算机视觉和自然语言处理等多个领域中取得了显著成功。在时间序列分析领域,一些研究发现即使是最简单的多层感知机网络在时间序列预测任务上也能胜过先进的基于变换器的网络。然
→
PDF
a year ago
通过权重残差的低阶逼近实现精调模型的高效存储
通过权重残差的低秩特性,本文提出了一种高效的存储 fine-tuned 模型的方法,称为 Efficient Residual Encoding(ERE),通过低秩权重残差的逼近来实现 fine-tuned 模型权重的高效存储,并通过使用额
→
PDF
a year ago
Prev
Next