Apr, 2024

人类反馈的最佳设计

TL;DR从人类反馈中学习偏好模型一直是人工智能领域最近进展的核心。本研究通过推广最优设计的概念,研究了用于学习偏好模型的数据收集问题,并提出了面向排名列表的有效算法,证明了模型估计器随更多数据而改善,估计器下的排名误差也随之减少,并在多个合成和真实数据集上进行实验以展示算法的统计效率。