关键词alignment methods
搜索结果 - 14
- ProgressGym:对千年道德进步的对齐PDF6 days ago
- 对话机器人性能提升的调整PDF7 days ago
- PaCE: 大型语言模型的简约概念工程PDFa month ago
- 对 DPO 及其变种在多个任务中的对齐研究PDF2 months ago
- 大规模语言模型的潜在距离指导对齐训练PDF3 months ago
- 大型语言模型的人类对齐通过在线偏好优化PDF4 months ago
- 噪声对比对齐语言模型与显性奖励PDF5 months ago
- InferAligner: 通过跨模型指导实现无害性的推理时间对齐PDF5 months ago
- RLHF 中的策略优化:偏离偏好数据的影响PDF7 months ago
- 通过基于良心的对齐框架抵御对抗性攻击PDF8 months ago
- 何时出现情境学习的短板以及原因?针对规约密集任务的研究PDF8 months ago
- 对防止生成有害信息而言,仅靠对齐是不够的:一个精神分析的视角PDF8 months ago
- 构建大型语言模型与多样反馈的一致性对齐PDF9 months ago
- EMNLP多语言 BERT 的跨语言对齐方法:一项比较研究PDF4 years ago
Prev
Next