Mar, 2024

Proxy-RLHF: 大规模语言模型中分离生成与对齐的代理模型

TL;DR我们介绍了一种代理强化学习方法(Proxy-RLHF),该方法解耦了生成和对齐大型语言模型的过程,以较低的计算成本实现与人类价值观的对齐。