关键词inference speed
搜索结果 - 107
  • 利用次路线线性近似模型加速图像生成
    PDF2 months ago
  • SKIP: 提高推理速度的技能本地化提示调优
    PDF3 months ago
  • CVPRLD-Pruner:使用任务无关见解高效修剪潜在扩散模型
    PDF3 months ago
  • CVPRTCCT-Net: 通过行为特征信号进行快速高效的参与度估计的双流网络架构
    PDF3 months ago
  • 走向快速推理:探索与改进分块并行草稿
    PDF3 months ago
  • 在有限区间内应用引导改善扩散模型的样本和分布质量
    PDF3 months ago
  • 大型语言模型的无损加速通过自适应 N-gram 并行解码
    PDF3 months ago
  • UniFL:通过统一反馈学习改善稳定扩散
    PDF3 months ago
  • 不是所有的注意力都有必要:针对多模态大型语言模型的参数和计算效率高的迁移学习
    PDF3 months ago
  • Fast-Poly: 三维多目标跟踪的快速多面体框架
    PDF3 months ago
  • 一步图像翻译与文本到图像模型
    PDF4 months ago
  • 图像恢复的高效扩散模型:残差位移
    PDF4 months ago
  • 一种双重自蒸馏的无教师图知识蒸馏框架
    PDF4 months ago
  • MMFlowPrecision: 使用线性量化提升基于 FPGA 的实时流体流动估计
    PDF4 months ago
  • 学习压缩自然语言格式中的提示
    PDF4 months ago
  • 大型语言模型的量化策略的全面评估
    PDF4 months ago
  • 生成遇见验证:智能并行自动校正解码加速大型语言模型推理
    PDF4 months ago
  • 可控扩散语言模型的量化嵌入向量
    PDF5 months ago
  • PaDeLLM-NER:大型语言模型中的并行解码用于命名实体识别
    PDF5 months ago
  • 利用链式抽象推理进行高效工具使用
    PDF5 months ago