BriefGPT.xyz
大模型
Ask
alpha
关键词
alignment methodologies
搜索结果 - 2
Xwin-LM:强大且可扩展的 LLM 对齐实践
Xwin-LM 是一套适用于大型语言模型(LLM)的综合对齐方法学,包括 SFT、RM、RS 和 DPO 等关键技术,并通过 AlpacaEval 和 MT-bench 的评估证明了其稳定和可扩展性。
PDF
a month ago
大型语言模型对齐:一项调查
大型语言模型(LLMs)的对齐方法研究,包括外部和内部对齐方法,探讨了其可解释性和对抗攻击的潜在漏洞以及评估方法,并展望了未来的研究方向。
PDF
9 months ago
Prev
Next