BriefGPT.xyz
大模型
Ask
alpha
关键词
teacher training
搜索结果 - 3
ICLR
基于条件互信息的贝叶斯条件分布估计用于知识蒸馏
通过引入条件互信息的概念以提高知识蒸馏中教师对未知贝叶斯条件概率分布的估计,本文提出了一种称为最大条件互信息方法的新估计器。通过对教师进行最大条件互信息估计,能够捕捉到图像聚类中更多的上下文信息,从而在各种先进的知识蒸馏框架中使用通过最大条
→
PDF
6 months ago
ChatGPT 是否是一位出色的教师辅导?通过测量零 - shot 性能,为课堂教学评分和提供可操作洞见
本研究探讨是否生成式人工智能可以作为自动化教练辅助专家反馈以成为对教师训练的一种有效补充。在这个过程中,针对小学数学课堂记录文本,我们提出了生成式人工智能的三种教师培训任务,并邀请数学领域专家评估了 ChatGPT 模型在每种任务上的表现。
→
PDF
a year ago
ACL
依据学生的学习水平定制指导方案提升知识蒸馏
本文提出了一种名为 LGTM 的有效教师培训技术,该技术通过引入蒸馏影响概念来确定每个训练样本对学生泛化能力的影响,通过优先选择可能增强学生泛化能力的样本,在 GLUE 基准测试数据集的 6 项文本分类任务中,LGTM 比其他 10 种常见
→
PDF
a year ago
Prev
Next