May, 2023
掌握复杂问题 ABCD:基于答案的主张分解进行细粒度自我评估
Mastering the ABCDs of Complex Questions: Answer-Based Claim Decomposition for Fine-grained Self-Evaluation
Nishant Balepur, Jie Huang, Samraj Moorjani, Hari Sundaram, Kevin Chen-Chuan Chang
TL;DR本文介绍了一种针对大型语言模型生成的答案自我评估技术,即 ABCD,该技术通过将复杂问题分解为一系列真假命题来验证模型生成的答案是否满足所有的问题标准, 并进行精细化评估,实验证明该技术可以帮助发现模型的错误和知识盲区。