关键词inference speed
搜索结果 - 109
  • 大型语言模型的知识蒸馏综述:方法、评估与应用
    PDF4 days ago
  • SPARKLE: 在解码过程中增强 SPARQL 生成的直接知识图谱集成
    PDF7 days ago
  • DISCO: 大规模组合优化问题的高效扩散求解器
    PDF8 days ago
  • SPIRONet:基于空间频率学习和拓扑通道交互的血管分割网络
    PDF8 days ago
  • 在 NVIDIA Jetson Nano 上为实时系统进行深度学习模型基准测试:一项实证研究
    PDF11 days ago
  • NARRepair: 自动程序修复的非自回归编码生成模型
    PDF12 days ago
  • MOYU: 大规模过度激活引起的语言模型提升的理论研究
    PDF18 days ago
  • ICMLQuest: 查询感知稀疏性用于高效长上下文 LLM 推断
    PDF20 days ago
  • 基于边缘智能脑机接口应用的神经解码骨干算法评估
    PDFa month ago
  • Open-YOLO 3D:面向快速准确的开放词汇的 3D 实例分割
    PDFa month ago
  • ManiCM: 实时三维扩散策略通过一致性模型用于机器人操纵
    PDFa month ago
  • 多模态跨领域少样本学习用于主体动作识别
    PDFa month ago
  • 最近邻假设解码用于 LLM 生成和归因
    PDFa month ago
  • KDD点击率预测的统一低秩压缩框架
    PDFa month ago
  • PatchScaler:一种高效的与补丁无关的扩散模型用于超分辨率
    PDFa month ago
  • Segformer++: 高分辨率语义分割的高效令牌合并策略
    PDFa month ago
  • 一致性策略:通过一致性蒸馏加速视觉动作策略
    PDF2 months ago
  • EMS-SD:高效的多样本猜测解码用于加速大型语言模型
    PDF2 months ago
  • 实时物体检测模型的复制研究和基准测试
    PDF2 months ago
  • 时空强化网络用于视频目标分割
    PDF2 months ago
Prev