关键词self-alignment
搜索结果 - 9
  • ICML通过 Nash 学习和自适应反馈进行语言对齐
    PDF12 days ago
  • 使用 DPO 隐式奖励进行自助式语言模型训练
    PDF20 days ago
  • 基于隐性奖励差异的经验偏好优化
    PDFa month ago
  • 深思专家的混合(MoTE):思维链和专家混合在自我对齐中的协同作用
    PDF2 months ago
  • 自我对齐以提高事实准确性:通过自我评估减少 LLMs 中的幻觉
    PDF5 months ago
  • 踩脚自校准:通过自启动扩展 LLM 的尺度自对准
    PDF5 months ago
  • 自我专业化:揭示大型语言模型中的潜在专长
    PDF9 months ago
  • 指导反向翻译的自对齐
    PDFa year ago
  • 多曝光图像融合中紧凑稳健的架构探讨
    PDFa year ago
Prev
Next