关键词length controlled generation
搜索结果 - 2
- ACL基于提示的长度受控生成与多种控制类型
通过采用强化学习和通过基于规则的奖励模型给出的奖励信号进行样本过滤的方式,我们提出了一种基于提示的方法,以不同的控制类型实现控制长度的生成,并在流行的摘要数据集上显著提高了准确率。
- 基于提示的长度控制生成与强化学习
我们提出了一种基于提示的长度控制方法,通过采用可训练或基于规则的奖励模型来影响大型语言模型的生成,从而实现长度可控的生成,该方法在广泛适用于类似 GPT 的大型语言模型的同时,显著提高了摘要任务中基于提示的长度控制的准确性。