Nov, 2023

用于高效多主题控制文本生成的继承特征

TL;DR大型语言模型(LLMs)在生成流畅和逼真的文本方面取得了令人印象深刻的性能,但控制生成的文本以展现安全性、真实性和无毒性等属性仍然具有挑战性。本研究提出了 SF-GEN,它基于两个主要概念:后继特征(SFs)用于将 LLM 的动态与任务特定奖励解耦,以及语言模型纠正以根据完成文本变为不希望的概率比例调整选择标记的概率。SF-GEN 无需改变 LLM 的参数即可实现对文本生成的动态导向,是一种在训练和解码过程中在内存和计算效率上都表现出色的方法,特别适用于处理多个目标主题。同时,我们的方法生成的语言质量与 SOTA(并且优于基准)在控制措施和语言质量方面相当,我们通过一系列各种可控文本生成任务的实验证明了这一点。