Jun, 2024

创造力已离开聊天窗口:语言模型去偏见的代价

TL;DR使用强化学习通过人类反馈进行对齐技术(RLHF)在大语言模型的创造力上产生意外后果。