BriefGPT.xyz
Ask
alpha
关键词
structured distillation
搜索结果 - 1
MAGDi: 多智能体交互图的结构化蒸馏提升较小语言模型的推理能力
通过多个大型语言模型之间的多智能体交互,结构化蒸馏途径(MAGDi)通过将多智能体交互表示为图形、通过图形编码器增强基础学生模型,并使用三个目标函数进行知识蒸馏,即下一个标记预测、正确和错误推理之间的对比损失以及基于图形的目标函数。对七个广
→
PDF
5 months ago
Prev
Next