关键词pre-training data
搜索结果 - 33
  • S4:自主监管跨频谱感知
    PDF2 months ago
  • 大型语言模型中基准测试的基准泄露
    PDF2 months ago
  • 分子性质预测的 Transformer 方法:过去五年的经验教训
    PDF3 months ago
  • 羊驼对抗维昆纳:利用 LLMs 揭示 LLMs 的记忆
    PDF4 months ago
  • 代码需要注释:用注释增强代码 LLMs
    PDF4 months ago
  • 预训练数据中的并行结构促进上下文学习
    PDF4 months ago
  • 通过伪标记成员的微调增强训练数据曝光
    PDF4 months ago
  • QuRating: 选择高质量数据以训练语言模型
    PDF5 months ago
  • 大型语言模型是否受到成员推断攻击的影响?
    PDF5 months ago
  • 利用声学伪标记预测正向迁移,以改进低资源语音识别
    PDF5 months ago
  • 基于有效评估模型提取的大规模高质量中文网络文本
    PDF8 months ago
  • 细节决定成败:深入探究数据过滤的兔子洞
    PDF9 months ago
  • 减少、重用、循环利用:扰动数据是否比其他语言增强对于低资源自我监督语音模型更好
    PDF9 months ago
  • 解锁差分隐私图像分类的准确度与公平性
    PDF10 months ago
  • ICLR西班牙预训练 BERT 模型与评估数据
    PDFa year ago
  • ICML从数据泄露和遗忘中对法律的启示
    PDFa year ago
  • RemoteCLIP: 远程感知的视觉语言基础模型
    PDFa year ago
  • 大型预训练模型中基本稀疏性的出现:重要的权重
    PDFa year ago
  • 理解大型语言模型在自动化规划方面的能力
    PDFa year ago
  • ACLMultiTabQA:为多表问答生成表格答案
    PDFa year ago
Prev