BriefGPT.xyz
Ask
alpha
关键词
training data density estimation
搜索结果 - 1
LMD3:语言模型数据密度依赖性
我们开发了一种基于训练数据密度估计的分析语言模型任务性能的方法。通过对有控制介入的细调数据进行释义实验,我们发现支持特定测试查询的训练分布的增加可导致密度的可测增加,这也是干预引起的性能增加的重要预测因素。通过预训练数据的实验,我们可以通过
→
PDF
2 months ago
Prev
Next