BriefGPT.xyz
Ask
alpha
关键词
heterogeneous preferences
搜索结果 - 4
通过个性化和偏好聚合来自异构反馈的基于原则的 RLHF
利用个性化和聚合两个框架解决存在异质人类反馈的增强学习中的问题并确保较高的样本效率。
PDF
2 months ago
ICML
基于群体决策离散选择模型的选择集优化
本文基于离散选择建模,针对整体权衡、最大化一致性或不一致性以及促进特定选择等问题,提出了一种优化框架,着重研究了直接更改选择集合对决策者群体偏好的影响,通过限制条件的引入,揭示了不同问题之间的基本边界,为难以解决的问题设计了近似算法,并展示
→
PDF
4 years ago
WWW
基于人气排名的寡头富者现象
本文研究了基于流行度的排序算法所导致的少数热门效应以及其在信息传播方面的重要影响。通过理论和实验分析,发现人们点击排名靠前的物品,并具有不同的物品偏好,导致物品流量不平衡,进而影响了信息的传播。
PDF
5 years ago
推荐系统与人的交互
该研究旨在了解推荐算法对未来用户数据的影响,通过提出一个简单模型,表明忽略这个反馈循环将导致非一致性评估器,因此验证了我们的结论。
PDF
7 years ago
Prev
Next