BriefGPT.xyz
大模型
Ask
alpha
关键词
benchmark overlap
搜索结果 - 2
评估语言模型代码生成能力时的污染量量化
该研究综合研究了大型语言模型在代码生成任务中的数据污染问题,分析了常见代码生成基准测试与预训练语料之间的重叠程度,并揭示了类似训练解决方案出现时模型性能显著提高的现象,同时分析了模型大小、问题难度和问题长度等因素对模型记忆和泛化的影响。
PDF
4 months ago
重新思考以重新表述的样本为基础的语言模型基准和污染问题
大型语言模型的数据污染问题及其对应的检查与净化方法
PDF
8 months ago
Prev
Next