Apr, 2024
通过基于变异的置信度平滑增强大型语言模型的故障检测
Enhancing Fault Detection for Large Language Models via Mutation-Based Confidence Smoothing
Qiang Hu, Jin Wen, Maxime Cordy, Yuheng Huang, Xiaofei Xie...
TL;DR现有的故障检测方法在大型语言模型上表现不佳,因此我们提出了一种名为 MuCS 的基于提示变异的预测置信度平滑方法,该方法能显著提升现有方法在测试覆盖率上的改进达到 97.64%。