关键词value alignment
搜索结果 - 18
  • 提高标准:通过生成进化测试研究大型语言模型的价值
    PDF14 days ago
  • 指令调整能提高 LLMs 的一致性吗?
    PDF2 months ago
  • 贪婪骆驼:金融价值对齐大型语言模型在道德推理中的性能
    PDF3 months ago
  • AI 推理中的人类价值建模
    PDF5 months ago
  • 生物 AI
    PDF5 months ago
  • 概念对齐
    PDF6 months ago
  • 价值基点:将大型语言模型映射到基本人类价值的多维谱系
    PDF8 months ago
  • 概念对齐作为价值对齐的前提条件
    PDF8 months ago
  • AceGPT,在阿拉伯语中本地化大型语言模型
    PDF9 months ago
  • 目标一致性:价值对齐问题的人类意识解释
    PDFa year ago
  • 反复斟酌方为上策:从文本编辑中学习重新调整与人类价值的对齐
    PDF2 years ago
  • 关于奖励推断对错误人类模型的敏感性
    PDF2 years ago
  • 自然发生故事原则预测的机器学习方法
    PDF2 years ago
  • AAAI为了更好的人机协作,向人类解释奖励函数
    PDF3 years ago
  • 使用规范先验训练价值对齐强化学习智能体
    PDF3 years ago
  • MM人工智能安全:量化视角下的现状
    PDF4 years ago
  • 从故事中学习规范:价值对准代理的先验
    PDF5 years ago
  • IJCAIAI 价值对齐中的道德效用函数必备的多样性
    PDF5 years ago
Prev
Next