关键词inference cost
搜索结果 - 19
  • 记忆 ³:带显式记忆的语言建模
    PDF5 days ago
  • 部署长上下文变压器的挑战:理论峰值性能分析
    PDF2 months ago
  • MultiBooth: 面向图像中全部文本概念生成
    PDF2 months ago
  • 计算病理学中的结构模型修剪以提高推理效率
    PDF3 months ago
  • 叠加提示:改善和加速检索增强生成
    PDF3 months ago
  • CVPRPikeLPN: 低精度神经网络的潜在效率问题缓解
    PDF3 months ago
  • AttentionStore:大型语言模型服务中多轮会话中的经济高效注意力重用
    PDF3 months ago
  • AI 部署开销:瓦特数何以驱动成本?
    PDF7 months ago
  • 循环线性变换
    PDF8 months ago
  • 多模导向网络用于缺失模态推断
    PDF10 months ago
  • 快速前馈网络
    PDF10 months ago
  • 贝叶斯风险转导器:具有可控对齐预测的转导器
    PDFa year ago
  • 动态令牌传递变换器用于语义分割
    PDFa year ago
  • 复杂任务的基石:领域转移下放射学报告的鲁棒性生成事件抽取
    PDFa year ago
  • 无梯度和演示的大型语言模型交互式任务的提示优化
    PDFa year ago
  • FrugalGPT:如何在降低成本和提高性能的同时使用大型语言模型
    PDFa year ago
  • Delta Keyword Transformer: 通过动态裁剪的多头自注意力将 Transformer 移植到边缘
    PDF2 years ago
  • KDDTransformer 模型的学习型 Token 裁剪
    PDF3 years ago
  • 利用冗余特征剪枝构建高效 ConvNets
    PDF6 years ago
Prev
Next