关键词alignment algorithms
搜索结果 - 8
  • SafeSora: 通过人类偏好数据集实现文本到视频生成的安全对齐
    PDF16 days ago
  • DeTox: 模型编辑的有毒子空间投影
    PDFa month ago
  • EFUF:用于减轻多模态大语言模型中幻觉的高效细粒度遗忘框架
    PDF5 months ago
  • 比对算法的机制性理解:以 DPO 和毒性为案例研究
    PDF6 months ago
  • 从人类反馈中进行吉布斯采样:基于可证明的 KL 约束的 RLHF 框架
    PDF7 months ago
  • 大型模型中的伦理价值一致性解析
    PDF8 months ago
  • 群体偏好优化:大型语言模型的少样本对齐
    PDF9 months ago
  • 线性成本下的度量和非度量近似变换
    PDF10 years ago
Prev
Next