BriefGPT.xyz
Ask
alpha
关键词
inference times
搜索结果 - 4
DAISY: 自适应数据自我监督的语音表示模型的早期退出
自主训练的语音模型在各种任务中已显示出其有用性,但其庞大的体积限制了在计算能力和内存较低的设备中的使用。本论文探讨了一种早期退出的方法,用于通过尽早退出网络的前向过程来减少延迟。我们介绍了数据自适应自主训练早期退出(DAISY)方法,该方法
→
PDF
a month ago
ACL
DynaMo: 动态多词采样加速语言模型推断
DynaMo 是一个多令牌预测语言模型套件,通过在预测联合概率分布的基础上动态预测多个令牌来减少净推理时间,实现了与基准 (Pythia-6.9B) 相同质量的生成文本,并获得 2.57 倍的加速,仅有 5.87% 和 2.67% 的参数和
→
PDF
2 months ago
AAAI
PARSAC: 并行样本一致性加速健壮的多模型拟合
我们提出了一种实时方法,用于从嘈杂数据中稳健地估计多个几何模型实例。
PDF
5 months ago
基于动态规划的全同态加密下优化逐层多项式逼近的高效私密推理
通过对激活函数进行逐层优化并调整密文模量链,本文提出了一种降低推理时间的隐私保护深度神经网络实现方法,可以将 ResNet-20 模型和 ResNet-32 模型的推理时间分别缩短 3.44 倍和 3.16 倍。
PDF
9 months ago
Prev
Next