BriefGPT.xyz
Ask
alpha
关键词
computational budgets
搜索结果 - 4
递归推测解码:通过无替换抽样加速 LLM 推理
递归推测解码是一种基于树的方法,利用抽样生成多样性的草稿令牌序列来加速大型语言模型,从而在固定的草稿序列长度和计算预算下取得了优越性能。
PDF
5 months ago
扩展计算能力不足以确保对抗性鲁棒性
通过推导「对抗鲁棒性的扩展规律」,本文旨在回答计算能力能在多大程度上推动对抗鲁棒性的进展,并发现了一些值得未来研究探索的方向,同时还提供了一个基于「timm」的基准测试框架供进一步的高效鲁棒深度学习分析。
PDF
7 months ago
合作还是企业控制?量化 NLP 对工业产物和贡献的依赖程度
自然语言处理中智能模型的进步与行业模型的重要性及其对学术论文的影响进行调查,发现与行业的合作在 NLP 出版物中有显著依赖性,并探讨了两种可能的解释。
PDF
7 months ago
FD-MobileNet:快速下采样策略优化的 MobileNet
本文介绍了一种适用于计算资源有限的场景(例如 10 到 140 MFLOPs)的网络 FD-MobileNet,其核心设计是在 MobileNet 框架中应用了极度的下采样策略,减少了计算成本、提高了信息容量和推理速度,并通过对 ILSVR
→
PDF
6 years ago
Prev
Next