关键词human preferences
搜索结果 - 45
- ACL跨文化对齐是否改变语言模型的常识道德?PDF8 days ago
- SafeSora: 通过人类偏好数据集实现文本到视频生成的安全对齐PDF12 days ago
- 大型语言模型人类偏好学习综述PDF15 days ago
- WildVision:使用人类偏好评估在野外的视觉语言模型PDF16 days ago
- PAL:异构偏好学习的多元对齐框架PDF20 days ago
- Diffusion-RPO:通过相对偏好优化对齐扩散模型PDF22 days ago
- LLM 自动竞技场:利用代理人对战和委员会讨论自动化评估 LLMPDFa month ago
- 使用未观测到的偏好异质性进行直接偏好优化PDFa month ago
- 学习多维人类偏好的文本到图像生成PDFa month ago
- 具有信息噪声分布的异方差偏好贝叶斯优化PDFa month ago
- CLHA: 人类对齐的简单而有效的对比学习框架PDF3 months ago
- Chatbot Arena: 通过人类偏好评估 LLM 的开放平台PDF4 months ago
- 奖励模型学习与直接策略优化:从人类偏好中学习的比较分析PDF4 months ago
- PhyGrasp: 基于物理信息的大型多模态模型的机器人抓取泛化PDF4 months ago
- 优化语言模型以符合人类偏好的问题的因果推断PDF4 months ago
- 上下文奖励:基于动态偏好调整的多目标基础模型对齐PDF5 months ago
- MLLM 作为评判者:以视觉 - 语言基准评估多模态 MLLMPDF5 months ago
- ICMLLLM 投票:人类选择与 AI 集体决策PDF5 months ago
- 通过表示工程将大型语言模型与人类偏好对齐PDF6 months ago
- 可提示行为:个性化多目标奖励从人类偏好PDF7 months ago
Prev