BriefGPT.xyz
Ask
alpha
关键词
plurality of opinions
搜索结果 - 1
PAL:异构偏好学习的多元对齐框架
大规模基础模型预训练在原始网络数据上,无法直接部署,需要经过广泛的与人类偏好的协调。本文提出 PAL 框架,将人类偏好的多样性融入到预训练策略中,通过理想点模型和混合建模方法,捕捉到群体偏好的多样性,同时学习一种常用的偏好潜空间,能够适应新
→
PDF
24 days ago
Prev
Next