BriefGPT.xyz
Ask
alpha
关键词
dss
搜索结果 - 2
ICML
剪枝以实现更好的领域通用性
本文研究:剪枝是否可靠地提升模型的泛化能力。我们发现现有剪枝方法像 L2 已经可以在目标域性能上提供小的改进。我们进一步提出了一种被称为 DSS 的新的剪枝评分方法,旨在直接提高模型的鲁棒性。通过实证实验,我们验证了我们的方法,并表明它可以
→
PDF
a year ago
关于对角状态空间模型的参数化和初始化
本文提出了一种简单的 S4 模型的对角变体 S4D,通过限制状态矩阵为全对角可保持原模型性能而又易于实现。
PDF
2 years ago
Prev
Next