May, 2024

通过上下文引导增强个性化并减少偏见的 CoS

TL;DR通过测量预测标记的可能性以及调控它,我们提出了适用于自动回归 LL 模型的简单无需训练的方法,被称为 CoS (Context Steering),使实践者能够根据其特定用例和终端用户群确定适当的上下文影响水平,并展示了 CoS 的各种应用,包括增强上下文影响以实现更好的个性化和减少模型偏差所产生的无用影响,此外,还展示了如何结合贝叶斯推断来量化互联网上的仇恨言论,我们在最先进的 LL 模型和基准测试上展示了 CoS 的有效性。