BriefGPT.xyz
大模型
Ask
alpha
关键词
over-confidence
搜索结果 - 3
自知力蒸馏用于学习模糊性
通过自知力蒸馏方法,有效地解决了语言模型在面对多义样本时过于自信地错误预测单一标签的问题,并通过重新校准置信度,在生成更好的标签分布上取得了显著的改进。同时,该方法相对于现有方法在训练模型时更高效,无需额外的训练过程来完善标签分布。
PDF
20 days ago
错配的两面:识别网络校准中的过度自信和不足自信预测
深度神经网络的适当置信度校准对于安全关键任务中的可靠预测至关重要。近期的研究强调了校准技术引入的置信度过高问题,并成功在各种任务上展示了其成果。然而,置信度过低问题尚未得到足够重视。本文首先引入了一种新的指标,即校准错误评分,用于识别整体和
→
PDF
a year ago
ICML
不要仅仅因为过度参数化而指责过度自信:二元分类校准的理论分析
本文通过理论证明和实验证明,在可实现的二元分类问题下,当数据由逻辑模型生成且样本量远大于参数个数时,对数回归具有固有的过度自信及其原因。作者还证明,存在其它激活函数和合适的损失函数,使得学习的分类器在某些概率值附近表现不足。
PDF
3 years ago
Prev
Next