关键词alignment methods
搜索结果 - 14
  • ProgressGym:对千年道德进步的对齐
    PDF6 days ago
  • 对话机器人性能提升的调整
    PDF7 days ago
  • PaCE: 大型语言模型的简约概念工程
    PDFa month ago
  • 对 DPO 及其变种在多个任务中的对齐研究
    PDF2 months ago
  • 大规模语言模型的潜在距离指导对齐训练
    PDF3 months ago
  • 大型语言模型的人类对齐通过在线偏好优化
    PDF4 months ago
  • 噪声对比对齐语言模型与显性奖励
    PDF5 months ago
  • InferAligner: 通过跨模型指导实现无害性的推理时间对齐
    PDF5 months ago
  • RLHF 中的策略优化:偏离偏好数据的影响
    PDF7 months ago
  • 通过基于良心的对齐框架抵御对抗性攻击
    PDF8 months ago
  • 何时出现情境学习的短板以及原因?针对规约密集任务的研究
    PDF8 months ago
  • 对防止生成有害信息而言,仅靠对齐是不够的:一个精神分析的视角
    PDF8 months ago
  • 构建大型语言模型与多样反馈的一致性对齐
    PDF9 months ago
  • EMNLP多语言 BERT 的跨语言对齐方法:一项比较研究
    PDF4 years ago
Prev
Next