BriefGPT.xyz
Ask
alpha
关键词
document selection
搜索结果 - 2
大规模语言模型引导的文档选择
LLM 预训练模型通过精心选择文档,可以在仅使用部分 FLOPs 的情况下实现与完整训练相当的模型质量;通过使用提示的 LLM 作为文档评分器,我们将质量标签提取并应用于大规模的互联网抓取数据集,以自动筛除部分文档,从而更好地匹配性能,并通
→
PDF
a month ago
众包多项选择题科学问题
本文提出一种新的方法来从众包工作者那里获得高质量、针对领域的多项选择题,该方法通过利用大量的领域特定文本和一小部分现有问题,产生文档选择和答案干扰选项的模型建议,辅助人类提问生成过程。使用这种方法,我们已经组装了 13.7K 的多项选择科学
→
PDF
7 years ago
Prev
Next