关键词downstream tasks
搜索结果 - 458
  • 线性复杂度语言模型的尺度定律
    PDF3 days ago
  • 重新思考大型语言模型剪枝:重构误差最小化的好处和陷阱
    PDF6 days ago
  • 连接事实:LLMs 可以从不同的训练数据推理和表达潜在结构
    PDF7 days ago
  • Transformer 中的无限长前缀
    PDF7 days ago
  • 关于采用领域相邻的精调模型集合在少样本问题中的效果的实用性
    PDF8 days ago
  • 检索增强生成的统一主动检索
    PDF9 days ago
  • KDD预训练视觉 - 语言模型的高效和长尾泛化
    PDF9 days ago
  • ptt5-v2:对 T5 模型在葡萄牙语上的持续预训练的深入研究
    PDF11 days ago
  • 医学基础模型综述
    PDF12 days ago
  • ICML候选伪标签学习:通过无标签数据及时调整以增强视觉 - 语言模型
    PDF12 days ago
  • PixRO: 基于像素分布的旋转测距与高斯置信传播
    PDF13 days ago
  • A$^{2}$-MAE:一种基于锚点感知屏蔽自编码器的空时谱统一遥感预训练方法
    PDF15 days ago
  • SynthForge: 利用可控 3D 生成模型合成高质量人脸数据集
    PDF15 days ago
  • 嵌入模型何时比其他模型更有前途?
    PDF16 days ago
  • RS-DFM:一种用于多样化下游任务的遥感分布式基础模型
    PDF16 days ago
  • 医学表征学习的视觉 - 语言对比方法的基准评估
    PDF16 days ago
  • MATES: 基于模型的数据选择与数据影响模型的高效预训练
    PDF17 days ago
  • ACLMedREQAL: 通过问答方式检验大型语言模型对医学知识的记忆能力
    PDF18 days ago
  • CorrMAE:预训练具有遮盖自编码器的对应变换器
    PDF18 days ago
  • TexIm FAST: 基于 Transformers 的文本 - 图像表示用于语义相似度评估
    PDF21 days ago
Prev