BriefGPT.xyz
Ask
alpha
关键词
latency optimization
搜索结果 - 3
基于缓存推断的流式自动语音识别中的有状态快速 Conformer
我们提出了一种基于 FastConformer 架构的高效准确的流式语音识别模型,在编码器中通过约束前向和后向上下文,并引入了激活缓存机制来实现非自回归编码器在推断过程中的自回归操作。我们的模型消除了许多流式模型中常见的训练与推断准确性差异
→
PDF
6 months ago
MM
协同无人机和卷积网络实现高效实时图像识别
在本文中,我们提出了一种旨在将推理请求分配到资源受限的 UAV 群体的策略,该策略可在无人机上对捕获的图像进行分类,并找到最小的决策延迟,其模型被制定为一个最小化获取图像与做出最终决策之间延迟的优化问题,我们提出了一种名为 DistInfe
→
PDF
3 years ago
CVPR
AOWS: 自适应和优化的网络宽度搜索及延迟限制
本研究提出了一种高效的一次性神经结构搜索方法,通过优化搜索通道数以求在特定硬件上的延迟限制下,获得较好的神经结构性能,并通过适应性通道策略逐步满足目标计算约束。在 ImageNet 分类的实验中,该方法可以找到符合资源约束的网络解决方案,同
→
PDF
4 years ago
Prev
Next