BriefGPT.xyz
大模型
Ask
alpha
关键词
scoring methods
搜索结果 - 5
语言模型对多项选择任务的预测在评分方法变化下不稳定
该研究系统比较了多个选择题语言模型的不同预测方法,包括根据生成的回答进行评分、基于概率的得分方法、李克特量表风格的评分方法和嵌入相似度。通过对实用语言解释的案例研究发现,语言模型的预测结果在方法选择的变化下不具有稳健性,无论是在单个语言模型
→
PDF
4 months ago
基于数据分布的课程学习
提出一种名为基于数据分布的课程学习(DDCL)的新型课程学习方法,通过评分方法确定训练样本的顺序,实验证明 DDCL 方法相对于无课程的标准评估,对多个数据集应用时,改善了平均分类准确率,并且通过错误损失分析表明,在单个训练时期,使用 DD
→
PDF
5 months ago
当少即是多:探究大规模预训练 LLMs 的数据修剪
通过比较数据质量的简单估算方法困惑度和更复杂、计算密集的评估方法的错误 L2 范数和记忆化,我们发现困惑度方法在去除数据噪声和提升预训练数据集质量方面具有较好的效果。我们能够在仅使用原始训练数据的 30% 进行训练的情况下,改进我们的基准模
→
PDF
10 months ago
VoxCeleb 2022 发言人识别挑战中的 ReturnZero 系统
本文介绍了团队 RTZR VoxCeleb 在闭合数据集、发言人验证 Track1 方面的顶尖成果,采用了 7 个模型,包含 3 种不同类型的模型结构,并注重训练模型来学习额外时域的信息。通过正确的评估过程,使用自适应对称规范化(AS-No
→
PDF
2 years ago
ICML
知识图谱表示学习负采样的综合分析
本研究通过理论分析负采样损失函数协助超参数调整,以及为知识图谱嵌入(KGE)学习特别设计的负采样子抽样方法,为解决 KGE 中负采样损失函数中的超参数过多导致性能下降的问题提供了可能。同时,研究还提出,针对不同的得分方法,需要适当调整边缘项
→
PDF
2 years ago
Prev
Next