关键词preferences
搜索结果 - 42
  • 利用学生反馈将 LLM 与助记学习相结合,形成类似于 “胶水疗法” 的智能助记
    PDF13 days ago
  • BPO:通过遵守行为近度增强在线偏好学习 LLM
    PDF16 days ago
  • 使用 LLMs 模拟目标人群的信念和偏好
    PDF3 months ago
  • 基于扩展的抽象论证中首选项计算与验证方法
    PDF3 months ago
  • 可控偏好优化:朝着可控的多目标对齐
    PDF4 months ago
  • 解剖人类和 LLM 偏好
    PDF5 months ago
  • 多 LLM 之间的网络形成与动态
    PDF5 months ago
  • 偏好条件下的语言引导抽象
    PDF5 months ago
  • KTO:模型对齐作为前景理论优化
    PDF5 months ago
  • 主观因果关系
    PDF6 months ago
  • 学习推断未观察到的行为:估计用户对某个站点的偏好高于其他站点
    PDF7 months ago
  • AAAI关于代理人目标、偏好和行为的神经推理
    PDF7 months ago
  • 情感对话机器人:理解期望和个人影响
    PDF8 months ago
  • 基于自然语言的增强式偏好学习
    PDF9 months ago
  • 通过对序列的偏好查询学习奖励机器
    PDFa year ago
  • 具有交互作用的子集比较的鲁棒序数回归
    PDFa year ago
  • 测量和控制排名聚合中的分裂问题
    PDFa year ago
  • AAAI道德机器还是多数暴政?
    PDFa year ago
  • ICLR离线多目标强化学习扩展帕累托高效决策
    PDFa year ago
  • 基于前景理论的跨期选择中的投影偏差建模
    PDFa year ago
Prev