BriefGPT.xyz
大模型
Ask
alpha
关键词
training data diversity
搜索结果 - 3
语言模型的物理学:3.1 部分,知识存储与提取
通过对半合成的传记数据进行深入研究,我们发现大语言模型的知识提取能力与训练数据的多样性之间存在着关联,同时通过 (几乎) 线性推测发现模型是否线性地编码实体名称的隐藏嵌入中的知识属性,或者在训练文本中其他标记的嵌入之间存在着强相关性。
PDF
9 months ago
反事实数据增强改进抽象摘要的真实性
该文章介绍了一种基于对抗数据增广的方法,用于提高 Abstractive summarization system 的 factual correctness, 相关方法包括将同一或不同类别的实体或名词的 WordNet hypernyms
→
PDF
2 years ago
超声速度重建的深度学习:训练数据多样性对稳定性和鲁棒性的影响
本文研究了使用多种几何和自然的模拟幻影结构对深度神经网络训练数据多样性的影响,并证明在使用同时包含几何和自然组织模型的数据集来训练网络时,可以提高模型在模拟和实测数据中预测声速的稳定性。
PDF
2 years ago
Prev
Next