BriefGPT.xyz
Ask
alpha
关键词
filtering methods
搜索结果 - 3
ICCV
数字中的魔鬼:走向稳健的多模式数据过滤器
通过分析多模态数据集,我们观察到包含数字等冗余信息对 CLIP 得分的深远影响,因此提出了一种基于文本的过滤方法,实验证明在选择数据的过程中超过原始 CLIP 得分过滤器的性能表现,并提供了改善 CLIP 训练有效性的有价值洞见,包括语言重
→
PDF
9 months ago
高效条件预训练用于迁移学习
提出了用于计算机视觉任务的预训练神经网络的有效过滤方法,包括图像分辨率下采样和数据子集筛选,验证结果表明这种方法明显降低了训练成本并提高了性能。
PDF
4 years ago
选择机器翻译数据快速引导自然语言理解系统
本文研究了使用机器翻译(MT)为大规模语音控制设备的新语言引导自然语言理解(NLU)系统的使用情况,并探讨了不同的 MT 数据过滤方法以及语言特定的后处理方法在大规模 NLU 任务中的应用。结果表明,使用 MT 数据可以大大提高 NLU 的
→
PDF
6 years ago
Prev
Next