BriefGPT.xyz
大模型
Ask
alpha
关键词
optimal designs
搜索结果 - 1
人类反馈的最佳设计
从人类反馈中学习偏好模型一直是人工智能领域最近进展的核心。本研究通过推广最优设计的概念,研究了用于学习偏好模型的数据收集问题,并提出了面向排名列表的有效算法,证明了模型估计器随更多数据而改善,估计器下的排名误差也随之减少,并在多个合成和真实
→
PDF
2 months ago
Prev
Next