关键词human preferences
搜索结果 - 45
  • ACL跨文化对齐是否改变语言模型的常识道德?
    PDF8 days ago
  • SafeSora: 通过人类偏好数据集实现文本到视频生成的安全对齐
    PDF12 days ago
  • 大型语言模型人类偏好学习综述
    PDF15 days ago
  • WildVision:使用人类偏好评估在野外的视觉语言模型
    PDF16 days ago
  • PAL:异构偏好学习的多元对齐框架
    PDF20 days ago
  • Diffusion-RPO:通过相对偏好优化对齐扩散模型
    PDF22 days ago
  • LLM 自动竞技场:利用代理人对战和委员会讨论自动化评估 LLM
    PDFa month ago
  • 使用未观测到的偏好异质性进行直接偏好优化
    PDFa month ago
  • 学习多维人类偏好的文本到图像生成
    PDFa month ago
  • 具有信息噪声分布的异方差偏好贝叶斯优化
    PDFa month ago
  • CLHA: 人类对齐的简单而有效的对比学习框架
    PDF3 months ago
  • Chatbot Arena: 通过人类偏好评估 LLM 的开放平台
    PDF4 months ago
  • 奖励模型学习与直接策略优化:从人类偏好中学习的比较分析
    PDF4 months ago
  • PhyGrasp: 基于物理信息的大型多模态模型的机器人抓取泛化
    PDF4 months ago
  • 优化语言模型以符合人类偏好的问题的因果推断
    PDF4 months ago
  • 上下文奖励:基于动态偏好调整的多目标基础模型对齐
    PDF5 months ago
  • MLLM 作为评判者:以视觉 - 语言基准评估多模态 MLLM
    PDF5 months ago
  • ICMLLLM 投票:人类选择与 AI 集体决策
    PDF5 months ago
  • 通过表示工程将大型语言模型与人类偏好对齐
    PDF6 months ago
  • 可提示行为:个性化多目标奖励从人类偏好
    PDF7 months ago
Prev