Jun, 2024

大型语言模型中的深度贝叶斯主动学习偏好建模

TL;DR通过提出一种新的随机获取策略,该模型可以在多种设置中以比以前的贝叶斯随机获取策略更少的偏好标签的情况下,在人类喜好数据集中获得 33% 至 68% 的偏好标签。