关键词alignment algorithms
搜索结果 - 8
- SafeSora: 通过人类偏好数据集实现文本到视频生成的安全对齐PDF16 days ago
- DeTox: 模型编辑的有毒子空间投影PDFa month ago
- EFUF:用于减轻多模态大语言模型中幻觉的高效细粒度遗忘框架PDF5 months ago
- 比对算法的机制性理解:以 DPO 和毒性为案例研究PDF6 months ago
- 从人类反馈中进行吉布斯采样:基于可证明的 KL 约束的 RLHF 框架PDF7 months ago
- 大型模型中的伦理价值一致性解析PDF8 months ago
- 群体偏好优化:大型语言模型的少样本对齐PDF9 months ago
- 线性成本下的度量和非度量近似变换PDF10 years ago
Prev
Next