关键词training costs
搜索结果 - 13
- ICML大型语言模型的进化子网络训练PDF25 days ago
- DeepSeek-V2: 一种强大、经济高效的专家混合语言模型PDF2 months ago
- MiniGPT-3D:利用 2D 先验信息高效对齐大型语言模型中的 3D 点云PDF2 months ago
- DiJiang: 通过紧凑核化实现高效的大型语言模型PDF3 months ago
- 基于显著文档上下文的神经机器翻译中改进词义消岐PDF7 months ago
- 丹麦基础模型PDF8 months ago
- EMNLPAdaSent: 高效领域自适应句子嵌入用于少样本分类PDF8 months ago
- FP8-LM:训练 FP8 大型语言模型PDF8 months ago
- ICCVDataDAM:高效数据集提炼与注意力匹配PDF9 months ago
- 基于完整参数和 LoRA 的微调在指令遵循大型语言模型的比较研究PDFa year ago
- MS-LSTM: 探索视频预测领域的时空多尺度表示PDFa year ago
- 稀疏训练通用框架的两个关键环节:层冻结和数据筛选PDF2 years ago
- 深度迁移学习与最近进展综述PDF2 years ago
Prev
Next