Mar, 2023

弹性权重去除用于忠实且抽象的对话生成

TL;DR提出了一种称为弹性权重剔除(EWR)的方法,该方法通过测量权重的不确定性来约束预先训练的模型参数,使得对话系统生成关于相关文件的信息时,不会产生错误或不可验证的信息。该方法使用 Flan-T5 作为主干语言模型,通过自动和人工评估表明,它在提高忠诚度方面具有系统性的优势。同时该方法还可以同时限制幻觉和提取响应,以防止浅层的复制和粘贴文档范围的情况。