Jan, 2024

GRATH: 大型语言模型渐进式自我真实化

TL;DR通过利用 GRAdual self-truTHifying (GRATH) 方法,不需要注释答案,仅使用问题提示和优化模型来提高大型语言模型的真实性,结果表明 GRATH 在 TruthfulQA 上取得了最先进的性能。