关键词data curation
搜索结果 - 30
  • FineWeb 数据集:对网络进行精细分离以获取大规模最佳文本数据
    PDF7 days ago
  • 通过联合示例选择进一步加速多模态学习
    PDF7 days ago
  • 大语言模型时代的数据中心化人工智能
    PDF12 days ago
  • Real3D:用真实世界图像扩展大型重建模型
    PDF20 days ago
  • fastMRI 乳腺:一份公开的乳腺动态增强磁共振成像的径向 k 空间数据集
    PDF25 days ago
  • 通过数据整理提高安全对齐的大型语言模型鲁棒性
    PDFa month ago
  • 自主驾驶中的高效主动学习:基于车辆动力学的场景表示来进行轨迹预测的无视觉感知
    PDF2 months ago
  • MahaSQuAD:马拉地语问答中的语言桥梁
    PDF2 months ago
  • CVPR数据筛选的缩放定律 —— 数据审查不能忽视计算特性
    PDF3 months ago
  • 用于鲁棒语言模型微调的自动数据整理
    PDF3 months ago
  • 通过验证器进行多步问题求解:基于模型引导的过程监督的实证分析
    PDF5 months ago
  • Dolma: 一个包含三万亿标记的开放语料库,用于语言模型预训练研究
    PDF5 months ago
  • 关于我:使用网页中的自我描述来记录英语预训练数据过滤的效果
    PDF6 months ago
  • Stellar: 人本个性化文本到图像方法的系统评估
    PDF7 months ago
  • 大型语言模型作为自动标定器用于基准测试视觉语言模型
    PDF7 months ago
  • Oasis: 大型语言模型预训练的数据筛选和评估系统
    PDF7 months ago
  • 通过模型自我消歧来学习多源数据的多功能医学图像分割
    PDF7 months ago
  • 消除 CLIP 数据的神秘
    PDF9 months ago
  • Lingua Manga: 基于大型语言模型的数据治理系统
    PDFa year ago
  • 使用文本 - 图像生成模型进行图像字幕的数据筛选
    PDFa year ago
Prev