Mar, 2024

细调 vs 触发,语言模型是否能理解人类价值观?

TL;DR未来我们将探索 fine-tuning 和 prompt tuning 在处理句子中潜在支持值的任务中的潜力,同时对大型语言模型与强化学习对齐在此任务中的能力进行初步尝试。