BriefGPT.xyz
Ask
alpha
关键词
preference alignment algorithms
搜索结果 - 1
无参考单块偏好优化与胜负比率
优先对齐算法、受监督的微调 (SFT)、单体化比值偏好优化算法 (ORPO)、最新的语言模型和模型检查点
PDF
4 months ago
Prev
Next