Feb, 2023

基于置信度校准和不确定性度量的现实对话问答与答案选择

TL;DR研究提出通过预测答案对话历史进行推理,并利用估计的置信度和不确定性过滤出不准确的答案, 最终将置信度和不确定性值进行校准,以此提高问答模型的性能表现。实验结果表明,该方法在两个标准 ConvQA 数据集上表现出了显著优于基线模型的效果。