Feb, 2024

解决因果语言模型中上下文示例的顺序敏感性问题

TL;DR我们提出了一种无监督的微调方法,称为信息增强和一致性增强方法,以减少在背景上下文示例的顺序敏感性,并展示出强大的泛化能力,特别是当演示示例来源于与训练阶段不同的池,或者当背景上下文示例数量与训练期间使用的数量不同时。