关键词inference efficiency
搜索结果 - 73
  • OPT-Tree:具有自适应草稿树结构的猜测解码
    PDF7 days ago
  • 基于 FFT-ReLU 的盲图像去模糊及其深度学习管线集成
    PDF20 days ago
  • SUBLLM:LLM 的一种新型高效架构及令牌序列子采样
    PDFa month ago
  • 通过推测解码实现更快级联
    PDFa month ago
  • 稀疏展开和神经元解缠
    PDFa month ago
  • COLING以 LLM 为基础通过并行解码词汇单元实现思考速度解码
    PDFa month ago
  • SFDDM: 单折蒸馏扩散模型
    PDFa month ago
  • ACL大型语言模型高效推理的层压化 KV 缓存
    PDFa month ago
  • DeepSeek-V2: 一种强大、经济高效的专家混合语言模型
    PDF2 months ago
  • FlashBack: 长文本推理的高效检索增强语言建模
    PDF2 months ago
  • LLMs 检索增强的连续提示学习中的终身知识编辑
    PDF2 months ago
  • 点击率预测的检索导向知识
    PDF2 months ago
  • IJCAI超越投机游戏:大型语言模型中投机执行调查
    PDF2 months ago
  • 大型语言模型的推理效率从粗粒度到细粒度评估
    PDF2 months ago
  • CVPR关于多模态大型语言模型的推理解码
    PDF3 months ago
  • CQIL:并发计算准独立层优化推理延迟
    PDF3 months ago
  • 面向推理最优的混合专家大语言模型
    PDF3 months ago
  • 将 NeRF 与特征匹配相结合的一步姿态估计
    PDF3 months ago
  • 针对 ViT 适应的参数和推理效率的动态调整
    PDF3 months ago
  • 跨语言词汇适应的实证研究:高效生成式 LLM 推理
    PDF5 months ago
Prev