BriefGPT.xyz
Ask
alpha
关键词
efficiency-accuracy trade-off
搜索结果 - 3
FFSplit:一种用于优化语言模型推理精度和效率权衡的分割前馈网络
优化预训练语言模型(PLM)在商用硬件上的部署,通过模型压缩技术提高效率,将 Feed-forward 网络划分为两部分以提高已有压缩方法的效果,并取得了可观的模型尺寸减小和推理速度提升的效果。
PDF
6 months ago
MM
LGViT:动态早期退出以加速视觉 Transformer
我们提出了一种早期退出的通用 ViTs 框架 LGViT,它通过引入异质退出头,包括局部感知头和全局聚合头,实现了效率和准确性的权衡,通过两阶段的训练方案,包括端到端训练和带有冻结骨干的自蒸馏,生成了早期退出的 ViTs,进一步促进了由这两
→
PDF
a year ago
CVPR
一项关于端到端时间动作检测的实证研究
本文介绍了一种基于端到端学习的方法进行时间动作检测,相对于只有检测头优化的方法,端到端学习可以带来多达 11% 的性能改进,并针对影响 TAD 性能和速度的多种设计选择进行了深入研究,并提出了更高效的检测器。
PDF
2 years ago
Prev
Next