BriefGPT.xyz
Ask
alpha
关键词
knowledge rationales
搜索结果 - 1
QCRD:基于质量引导的对比理由蒸馏用于大型语言模型
通过对比性理由蒸馏,我们提出了一种质量引导的方法用于推理能力学习,能够从大型语言模型中提取正面和负面的知识理由,并通过在线更新的判别器优化训练过程,得到更高质量的可解释性底层语言模型。
PDF
2 months ago
Prev
Next