Sep, 2024

集成价值引导下的推理时语言模型对齐

TL;DR本研究针对大语言模型在对齐人类偏好时面临的计算复杂性问题,提出了一种新方法“集成价值引导”(IVG)。该方法通过在推理阶段利用隐式和显式价值函数引导语言模型解码,从而实现高效对齐,显著提升了模型在情感生成和总结任务中的表现,并在指令跟随基准测试中验证了其有效性。