Nov, 2023

针对事实性的语言模型微调

TL;DR通过利用外部知识库的一致性或大模型的置信度,以及直接优化算法,我们在不需要人工标注的情况下,对语言模型进行微调,明显提高了生成候选项的正确性,并比对准确性进行了目标定向的RLHF和解码策略有显著改善。