BriefGPT.xyz
Ask
alpha
关键词
consistency score
搜索结果 - 2
大型语言模型是否总能解决简单问题,如果它们能解决更困难的呢?
研究中提出了 ConsisEval 基准,用于量化大型语言模型的一致性,并通过相对一致性得分分析改进一致性的潜力。综合实验结果表明,尽管 GPT-4 的一致性得分最高,但仍然对特定问题存在不一致性,这可能是由于多余信息干扰、对问题的错误解读
→
PDF
18 days ago
ICML
在过度参数化模型中表征标记数据的结构规律
该论文分析了神经网络模型对个别实例的处理方式,通过一致性得分来表征模型的预期准确度,并使用采样自数据分布的不同大小的训练集对多个数据集中的个别实例进行了实证估计,从而确定模型处理模式与模式的一致性,该方法可应用于分析深度学习系统中的过分拟合
→
PDF
4 years ago
Prev
Next