BriefGPT.xyz
大模型
Ask
alpha
关键词
pretraining corpus
搜索结果 - 2
通过机器学习去除预训练数据对大型语言模型的影响解析
通过对 LLMs 的 48 个数据集进行系统分析,我们测量了它们对 LLMs 的性能的影响,并研究了它们之间的相关关系,从而为更有效的 LLMs 预训练提供了洞见。
PDF
5 months ago
ACL
大规模语言模型语境学习中预训练语料对效果的影响
研究了韩国中心型 GPT-3 模型 HyperCLOVA 中的上下文零样本和少样本学习,发现性能主要取决于语料库域源和预训练语料库的大小,可以通过组合多个语料库预先训练获得上下文学习能力.
PDF
2 years ago
Prev
Next