May, 2024

Xwin-LM:强大且可扩展的 LLM 对齐实践

TL;DRXwin-LM 是一套适用于大型语言模型(LLM)的综合对齐方法学,包括 SFT、RM、RS 和 DPO 等关键技术,并通过 AlpacaEval 和 MT-bench 的评估证明了其稳定和可扩展性。