关键词inference efficiency
搜索结果 - 73
  • Conversational SimulMT: 大型语言模型的高效实时翻译
    PDF5 months ago
  • 基于锚定的大型语言模型
    PDF5 months ago
  • LLaMA 简化: 大型语言模型的简单深度修剪
    PDF5 months ago
  • DE$^3$-BERT: 基于原型网络的 BERT 增强距离提前退出
    PDF5 months ago
  • 通过嵌入相似性实现高效的提示缓存
    PDF5 months ago
  • BiTA: 大型语言模型的无损加速的双向调整
    PDF5 months ago
  • APT: 自适应剪枝和调整预训练语言模型用于高效训练和推理
    PDF5 months ago
  • VIPTR:一种用于快速高效的场景文本识别的可置换视觉特征提取器
    PDF6 months ago
  • 自适应引导:无需训练的条件扩散模型加速
    PDF6 months ago
  • 基于 RGB-D 数据的工业异常检测双支路重构网络
    PDF8 months ago
  • 在 CPU 上的扩散模型的有效量化
    PDF8 months ago
  • 在 CPU 上高效 LLM 推断
    PDF8 months ago
  • EMNLP提升推理效率:释放参数共享的预训练语言模型的力量
    PDF8 months ago
  • EMNLP压缩上下文以增强大型语言模型的推理效率
    PDF9 months ago
  • 无监督成分句法分析的集成蒸馏
    PDF9 months ago
  • 增强推荐系统中的跨类别学习:多层嵌入训练
    PDF9 months ago
  • 扩散条件期望模型用于高效稳健的目标语音提取
    PDF9 months ago
  • 时间耐心:嵌入式雷达数据处理的高效自适应深度学习
    PDF10 months ago
  • 移动版 V-MoEs:通过稀疏的专家混合缩小视觉变形器
    PDF10 months ago
  • 面向高效图像识别的低延迟统一动态网络
    PDF10 months ago