关键词downstream tasks
搜索结果 - 458
- 线性复杂度语言模型的尺度定律PDF3 days ago
- 重新思考大型语言模型剪枝:重构误差最小化的好处和陷阱PDF6 days ago
- 连接事实:LLMs 可以从不同的训练数据推理和表达潜在结构PDF7 days ago
- Transformer 中的无限长前缀PDF7 days ago
- 关于采用领域相邻的精调模型集合在少样本问题中的效果的实用性PDF8 days ago
- 检索增强生成的统一主动检索PDF9 days ago
- KDD预训练视觉 - 语言模型的高效和长尾泛化PDF9 days ago
- ptt5-v2:对 T5 模型在葡萄牙语上的持续预训练的深入研究PDF11 days ago
- 医学基础模型综述PDF12 days ago
- ICML候选伪标签学习:通过无标签数据及时调整以增强视觉 - 语言模型PDF12 days ago
- PixRO: 基于像素分布的旋转测距与高斯置信传播PDF13 days ago
- A$^{2}$-MAE:一种基于锚点感知屏蔽自编码器的空时谱统一遥感预训练方法PDF15 days ago
- SynthForge: 利用可控 3D 生成模型合成高质量人脸数据集PDF15 days ago
- 嵌入模型何时比其他模型更有前途?PDF16 days ago
- RS-DFM:一种用于多样化下游任务的遥感分布式基础模型PDF16 days ago
- 医学表征学习的视觉 - 语言对比方法的基准评估PDF16 days ago
- MATES: 基于模型的数据选择与数据影响模型的高效预训练PDF17 days ago
- ACLMedREQAL: 通过问答方式检验大型语言模型对医学知识的记忆能力PDF18 days ago
- CorrMAE:预训练具有遮盖自编码器的对应变换器PDF18 days ago
- TexIm FAST: 基于 Transformers 的文本 - 图像表示用于语义相似度评估PDF21 days ago
Prev