关键词latency reduction
搜索结果 - 32
  • ConvoCache:智能重用聊天机器人回复
    PDF8 days ago
  • LLMLingua-2: 数据去噪 以提升高效及精确的无要求任务的提示压缩
    PDF3 months ago
  • 单一背景大批量采样的分叉注意力
    PDF4 months ago
  • 关注、蒸馏和表格化:面向实用的基于神经网络的预取
    PDF6 months ago
  • 扩散模型中通过重用注意力图实现快速推理
    PDF7 months ago
  • LongLLMLingua:通过提示压缩加速和增强长背景下的 LLMs
    PDF9 months ago
  • 边思考边说话:文本生成期间的实时流式语音合成
    PDF9 months ago
  • 流式端到端语音识别序列转导器的最小延迟训练
    PDF2 years ago
  • 快速高效语音系统统一的端到端语音识别和端点检测
    PDF2 years ago
  • TrimTail: 简单但有效的声谱长度惩罚实现低延迟流式自动语音识别
    PDF2 years ago
  • 边缘智能加速元宇宙发展:元宇宙与移动边缘计算的融合
    PDF2 years ago
  • CUSIDE:基于分块、模拟未来上下文和解码的流式 ASR
    PDF2 years ago
  • 多语言同声传译
    PDF2 years ago
  • 一个时间步长就足够了:使用超低延迟训练脉冲神经网络
    PDF3 years ago
  • 寻找可控图像恢复网络
    PDF4 years ago
  • FastEmit: 序列级发射正则化的低延迟流式自动语音识别
    PDF4 years ago
  • EMNLP自适应训练的流畅低延迟语音同传翻译
    PDF4 years ago
  • EMNLP基于向量 - 向量 - 矩阵架构的硬件感知框架:用于 NLP 应用中的低延迟推断
    PDF4 years ago
  • 是滤波剪枝,还是层剪枝,这是一个问题
    PDF4 years ago
  • 使用部分假设选择实现低延迟序列到序列的语音识别和翻译
    PDF4 years ago
Prev