Apr, 2025
用来调节工具代理的模型内部置信度估计的MICE
MICE for CATs: Model-Internal Confidence Estimation for Calibrating
Agents with Tools
TL;DR本研究解决了工具使用代理在执行任务时的置信度校准问题,提出了一种新颖的模型内部置信度估计器(MICE),通过解码语言模型的中间层来评估置信度。研究发现,MICE在工具调用的效率和置信度上显著优于现有基线,具备样本效率高和对新API的零次泛化能力,能够在不同风险水平的场景中实现更高的工具调用效用。