关键词pretraining data
搜索结果 - 21
  • GPT:下一个 Token 预测是否足够?对代码逻辑理解的探索
    PDF2 months ago
  • 数据混合规律:通过预测语言建模性能来优化数据混合
    PDF3 months ago
  • 上下文学习的双重操作模式
    PDF4 months ago
  • 大型语言模型下游任务性能的缩放规律
    PDF5 months ago
  • 关于我:使用网页中的自我描述来记录英语预训练数据过滤的效果
    PDF5 months ago
  • LLaMA 跨越英语:语言能力转移的实证研究
    PDF6 months ago
  • Oasis: 大型语言模型预训练的数据筛选和评估系统
    PDF7 months ago
  • 数据相似性无法充分解释语言模型的性能
    PDF7 months ago
  • 在黑盒语言模型中证明测试集污染
    PDF8 months ago
  • EMNLP分布假设并不能完全解释掩蔽语言模型预训练的好处
    PDF8 months ago
  • 对比交叉模态模型的语言编码器
    PDF8 months ago
  • ACL通过支持预训练数据理解上下文学习
    PDFa year ago
  • VicTR: 视频条件的文本表示用于活动识别
    PDFa year ago
  • ACL自然语言处理中预训练模型自动对齐的价值:满足低资源语言需求
    PDFa year ago
  • 预训练模型中非受控的词汇暴露导致组合泛化被高估
    PDF2 years ago
  • EMNLP最近邻语言模型用于风格可控生成
    PDF2 years ago
  • Pix2Struct: 屏幕截图解析用于视觉语言理解的预训练
    PDF2 years ago
  • 预训练词频对少样本推理的影响
    PDF2 years ago
  • 多模态转换器中数据、注意力和损失的解耦
    PDF3 years ago
  • EMNLP预训练数据的成本效益选择:在社交媒体上预训练 BERT 的案例研究
    PDF4 years ago
Prev