Dec, 2022

如何通过波束搜索提高生成序列标注中的跨度级别置信度估计?

TL;DR本文旨在提供一些关于如何估计生成序列标注模型的置信度的实证见解,特别是如何可靠地评估模型对每个标记的预测置信度,我们发现,简单地使用解码器的输出概率并不是实现良好校准置信度估计的最佳方法,而我们提出的通过顶部 - k 预测的统计数据的方法,在六个不同任务的公共数据集上得到了验证。