Sep, 2024

Ruler:一种与模型无关的控制大规模语言模型生成长度的方法

TL;DR本研究针对大规模语言模型在生成指定长度响应时的困难,提出了目标长度生成任务(TLG)及评估模型执行力的精确匹配(PM)和灵活匹配(FM)指标. 我们引入了一种名为Ruler的模型无关方法,通过元长度标记(MLTs)增强模型的指令-following能力,能够在指定长度约束下生成响应,并在缺乏明确约束时自动生成合适的MLT. 实验表明Ruler在TLG上的效果显著,带来了明显的性能提升。