BriefGPT.xyz
Ask
alpha
关键词
confidence level
搜索结果 - 5
ICML
自信感感知的逆约束强化学习
逆向约束强化学习 (Inverse Constraint Reinforcement Learning, ICRL) 领域研究了从离线专家演示中估计约束的算法,并提供了一种基于置信水平对专家演示进行约束估计的方法,使用户可以选择满足期望置信
→
PDF
12 days ago
几何视角下的焦点损失:降低曲率以增强模型校准
机器学习算法在决策情境中的关键因素不仅是模型的准确性,还包括模型的置信水平。然而,模型在分类问题中的置信水平常常与实际预期的模型置信明显偏离。本研究旨在通过对焦损失函数进行几何重新解释,以理解焦损失的行为。我们的分析表明,焦损失可以降低训练
→
PDF
2 months ago
用样本一致性校准大型语言模型
通过从多个随机抽样的模型生成的分布中导出确定度來提高大型语言模型 (LLM) 预测的准确度。在多个开放和闭源模型上进行广泛评估,结果表明基于一致性的校准方法优于现有的事后方法,并提供了选择适用于不同 LLMs 特性的合适一致性度量标准的实用
→
PDF
5 months ago
MathPrompter:利用大型语言模型进行数学推理
提出了一种名为 MathPrompter 的技术,它使用 Zero-shot chain-of-thought 提示技术生成多个代数表达式或 Python 函数,并以不同的方式解决相同的数学问题,从而提高模型在算术问题上的性能并提高置信水平
→
PDF
a year ago
基于神经网络输出层分布的分类置信度估计
本文提出了一种基于 logit 值分布的神经网络分类模型的不确定性预测和置信水平估计方法,可用于知识提取过程中的预测筛选,并在关系提取、命名实体识别和图像分类等任务中获得显著的提高。
PDF
2 years ago
Prev
Next