关键词reward models
搜索结果 - 32
  • 纷扰的细粒度反馈:超越赞 / 踩 —— 面向文本到图像生成的挑战
    PDF10 days ago
  • 正则化隐藏状态实现学习面向通用化奖励模型的长期记忆模型
    PDF20 days ago
  • HelpSteer2: 用于训练最佳奖励模型的开源数据集
    PDF22 days ago
  • 奖励和策略模型在强化学习中的无缝衔接探讨
    PDF22 days ago
  • 联合演示与偏好学习改善与人类反馈的政策对齐
    PDF23 days ago
  • ACL数据有效的强化学习高阶函数的典型奖励网络
    PDFa month ago
  • 改进奖励模型通过合成批评
    PDFa month ago
  • 通过保守微调扩散模型,建立基于模型的优化和生成建模的桥梁
    PDFa month ago
  • 具有多功能奖励模型的成本效益的在线多 LLM 选择
    PDFa month ago
  • RLHF 揭示:对于 LLMs 的强化学习从人类反馈的关键分析
    PDF3 months ago
  • 大型语言模型中的风险与应对:评估关键威胁类别
    PDF3 months ago
  • RewardBench:评估语言建模的奖励模型
    PDF3 months ago
  • 基于策略的强化学习推进文本驱动的胸部 X 射线图生成
    PDF4 months ago
  • 无偏好的对齐学习与正则化相关回报
    PDF5 months ago
  • 自奖励语言模型
    PDF6 months ago
  • 大型语言模型中 RLHF 的秘密之二:奖励建模
    PDF6 months ago
  • 利用函数逼近进行实验规划
    PDF6 months ago
  • 帮助还是群集?奖励模型集合缓解但无法消除奖励攻击
    PDF7 months ago
  • EMNLP长文问答中的公理化偏好建模
    PDF7 months ago
  • 高效基于奖励引导的大型语言模型集成的专家路由
    PDF8 months ago
Prev