关键词inference speed
搜索结果 - 109
  • PaDeLLM-NER:大型语言模型中的并行解码用于命名实体识别
    PDF5 months ago
  • 利用链式抽象推理进行高效工具使用
    PDF5 months ago
  • OWSM v3.1:基于 E-Branchformer 的更好更快的开放式耳语口语模型
    PDF5 months ago
  • 基于文本图的大型语言模型的高效调优和推理
    PDF5 months ago
  • 基于一致性模型的歌声转换
    PDF6 months ago
  • MobileVLM: 移动设备上快速、可重现和强大的视觉语言助手
    PDF6 months ago
  • Lookahead: 大型语言模型的推理加速框架,保持生成准确性
    PDF7 months ago
  • LLM 闪电般的运算:利用有限内存高效推理的大型语言模型
    PDF7 months ago
  • EMNLPDiffuVST: 用全局历史引导的去噪模型叙述虚构场景
    PDF7 months ago
  • MobileDiffusion:移动设备上的次秒级文本到图像生成
    PDF7 months ago
  • SinSR: 单步扩散图像超分辨率
    PDF7 months ago
  • DELIFFAS: 快速化身综合的可变形光场
    PDF9 months ago
  • EMNLPNASH: 一个简单统一的结构剪枝加速编码 - 解码语言模型框架
    PDF9 months ago
  • 利用时间步调节器实现更准确的扩散模型加速
    PDF9 months ago
  • 用于腿型机器人的全脉冲神经网络
    PDF9 months ago
  • 双粒度量化:LLM 的高效细粒度量化
    PDF9 months ago
  • 用一致性蒸馏加速基于扩散的文本到音频生成
    PDF10 months ago
  • 实时语义分割:遥感中的简要调查与比较研究
    PDF10 months ago
  • OmniQuant:大型语言模型的全向校准量化
    PDF10 months ago
  • 利用早期退出在自动调制分类中进行快速推断
    PDF10 months ago