关键词data curation
搜索结果 - 30
- FineWeb 数据集:对网络进行精细分离以获取大规模最佳文本数据PDF7 days ago
- 通过联合示例选择进一步加速多模态学习PDF7 days ago
- 大语言模型时代的数据中心化人工智能PDF12 days ago
- Real3D:用真实世界图像扩展大型重建模型PDF20 days ago
- fastMRI 乳腺:一份公开的乳腺动态增强磁共振成像的径向 k 空间数据集PDF25 days ago
- 通过数据整理提高安全对齐的大型语言模型鲁棒性PDFa month ago
- 自主驾驶中的高效主动学习:基于车辆动力学的场景表示来进行轨迹预测的无视觉感知PDF2 months ago
- MahaSQuAD:马拉地语问答中的语言桥梁PDF2 months ago
- CVPR数据筛选的缩放定律 —— 数据审查不能忽视计算特性PDF3 months ago
- 用于鲁棒语言模型微调的自动数据整理PDF3 months ago
- 通过验证器进行多步问题求解:基于模型引导的过程监督的实证分析PDF5 months ago
- Dolma: 一个包含三万亿标记的开放语料库,用于语言模型预训练研究PDF5 months ago
- 关于我:使用网页中的自我描述来记录英语预训练数据过滤的效果PDF6 months ago
- Stellar: 人本个性化文本到图像方法的系统评估PDF7 months ago
- 大型语言模型作为自动标定器用于基准测试视觉语言模型PDF7 months ago
- Oasis: 大型语言模型预训练的数据筛选和评估系统PDF7 months ago
- 通过模型自我消歧来学习多源数据的多功能医学图像分割PDF7 months ago
- 消除 CLIP 数据的神秘PDF9 months ago
- Lingua Manga: 基于大型语言模型的数据治理系统PDFa year ago
- 使用文本 - 图像生成模型进行图像字幕的数据筛选PDFa year ago
Prev