关键词self-alignment
搜索结果 - 9
- ICML通过 Nash 学习和自适应反馈进行语言对齐PDF12 days ago
- 使用 DPO 隐式奖励进行自助式语言模型训练PDF20 days ago
- 基于隐性奖励差异的经验偏好优化PDFa month ago
- 深思专家的混合(MoTE):思维链和专家混合在自我对齐中的协同作用PDF2 months ago
- 自我对齐以提高事实准确性:通过自我评估减少 LLMs 中的幻觉PDF5 months ago
- 踩脚自校准:通过自启动扩展 LLM 的尺度自对准PDF5 months ago
- 自我专业化:揭示大型语言模型中的潜在专长PDF9 months ago
- 指导反向翻译的自对齐PDFa year ago
- 多曝光图像融合中紧凑稳健的架构探讨PDFa year ago
Prev
Next