Jun, 2024

用 LM-Polygraph 为大型语言模型基准化不确定性量化方法

TL;DR使用新的基准测试实现了对大规模语言模型在不确定性量化和归一化技术方面的评估,旨在解决其在文本生成任务中的不安全性和低质量输出等挑战。