BriefGPT.xyz
大模型
Ask
alpha
关键词
large-scale annotated datasets
搜索结果 - 2
SubjectDrive:通过主体控制在自动驾驶中扩大生成数据规模
自动驾驶进展依赖于大规模标注数据集。本研究探索生成模型在自动驾驶应用中产生大量自由标注数据的潜力,并提出了 SubjectDrive,这是第一个已证实能够持续改进自动驾驶应用的规模化生成数据生产模型。我们研究了扩大生成数据量对下游感知模型性
→
PDF
3 months ago
通过统计检验和自动数据增强解析自然语言推理中的词汇偏见数据集以减少人为影响
通过利用一种新颖的统计测试方法,我们发现词汇分布与文本蕴含类之间存在显著关联,强调词汇是一种明显的偏差源。为了减轻这些问题,我们提出了几种自动数据增强策略,从字符到词级别。通过对 ELECTRA 预训练语言模型进行微调,我们将有增强数据的模
→
PDF
7 months ago
Prev
Next