BriefGPT.xyz
Ask
alpha
关键词
chain-of-thought distillation
搜索结果 - 3
ICML
基于关键点的渐进式思维链提取法用于 LLMs
KPOD 框架通过利用遮罩学习来鼓励学生精确模仿关键点标记,并通过渐进式教学策略逐步扩展到整个论证过程,实现了来自大型语言模型的推理能力向较小学生模型的转移,取得了远超之前方法的广泛实验结果。
PDF
a month ago
学习最大化互信息用于思路链提炼
利用连续思维蒸馏的知识蒸馏技术,通过多任务学习框架,最大化两个训练任务的特征表示的互信息,提出一种变分方法来优化小型模型的推理能力和标签预测的整合性,并在四个数据集上超越先进的 DSS 方法,为语言模型蒸馏和连续思维相关应用的未来研究提供有
→
PDF
4 months ago
心灵之镜:从大型语言模型中提炼自我评估能力和综合思考
大型语言模型(LLMs)在自然语言处理领域取得了显著的进展,但是考虑到它们的规模和计算需求,将这些模型实际部署在资源受限的环境中面临着巨大的挑战。为了解决这些问题,我们提出了一种双重方法:首先,我们引入了一种将 LLMs 中固有的自我评价能
→
PDF
8 months ago
Prev
Next