Nov, 2023

Safer-Instruct: 与自动偏好数据对齐的语言模型

TL;DRSafer-Instruct 是一种半自动构建大规模偏好数据集的新型流程,利用反向指令调整、指令归纳和专家模型评估,高效生成高质量的偏好数据,改善模型安全性并在会话和下游任务上保持竞争性能。