BriefGPT.xyz
大模型
Ask
alpha
关键词
stat
搜索结果 - 2
STAT:训练后的 Transformer 收缩
我们提出了 STAT 算法,一种简单的算法用于修剪 transformer 模型,而无需进行任何微调。STAT 通过计算下一层权重的修正来压缩网络中的注意力头和神经元,同时保持精度,并使用一系列有原则的矩阵分解方法来压缩网络结构。该算法仅需
→
PDF
a month ago
STAT: 通往可推广的时间动作定位
提出了一种弱监督时序动作定位算法 STAT,通过引入自监督时序自适应教师模块和对齐模块,在不同数据分布下显著提高了动作定位方法的泛化能力。
PDF
2 months ago
Prev
Next