关键词training costs
搜索结果 - 13
  • ICML大型语言模型的进化子网络训练
    PDF25 days ago
  • DeepSeek-V2: 一种强大、经济高效的专家混合语言模型
    PDF2 months ago
  • MiniGPT-3D:利用 2D 先验信息高效对齐大型语言模型中的 3D 点云
    PDF2 months ago
  • DiJiang: 通过紧凑核化实现高效的大型语言模型
    PDF3 months ago
  • 基于显著文档上下文的神经机器翻译中改进词义消岐
    PDF7 months ago
  • 丹麦基础模型
    PDF8 months ago
  • EMNLPAdaSent: 高效领域自适应句子嵌入用于少样本分类
    PDF8 months ago
  • FP8-LM:训练 FP8 大型语言模型
    PDF8 months ago
  • ICCVDataDAM:高效数据集提炼与注意力匹配
    PDF9 months ago
  • 基于完整参数和 LoRA 的微调在指令遵循大型语言模型的比较研究
    PDFa year ago
  • MS-LSTM: 探索视频预测领域的时空多尺度表示
    PDFa year ago
  • 稀疏训练通用框架的两个关键环节:层冻结和数据筛选
    PDF2 years ago
  • 深度迁移学习与最近进展综述
    PDF2 years ago
Prev
Next