BriefGPT.xyz
大模型
Ask
alpha
关键词
teacher agent
搜索结果 - 2
大型语言模型作为训练强化学习智能体的良好策略导师
通过使用大规模语言模型,我们提出了一种新的框架,通过从语言模型教师代理接收指导行为,训练一个小规模专用的学生代理。通过将语言模型的先验知识融入到本地学生模型中,该学生代理可以用较少的数据进行训练,并通过环境反馈进一步提升其能力。实验结果表明
→
PDF
7 months ago
Teacher Agent: 基于再训练的视频增量学习的非知识蒸馏方法
本文旨在探究基于视频的社交媒体的应用,提出了一种新的增量学习技术 —— 知识蒸馏。该技术通过引入稳定准确的软标签来取代教师模型的输出,解决了教师模型预测不准确的问题和计算过载问题。经过大量实验,该方法在输入一半的视频分辨率下,已经可以超越最
→
PDF
a year ago
Prev
Next