BriefGPT.xyz
Ask
alpha
关键词
japanese uncertain scenes dataset
搜索结果 - 1
ACL
过度自信是关键:大型语言和视觉 - 语言模型中的口头不确定性评估
该论文评估了语言和视觉 - 语言模型的可靠性,并提出了新的日本不确定场景数据集以及测量校准误差的方法。结果表明,语言和视觉 - 语言模型都存在较高的校准误差,并且大部分时间都表现出过度自信,说明其对不确定性估计的能力较弱。此外,研究还发展了
→
PDF
2 months ago
Prev
Next