BriefGPT.xyz
大模型
Ask
alpha
关键词
task recognition
搜索结果 - 3
探究上下文学习的预训练动态:任务识别与任务学习
利用预先训练的先验知识,通过任务识别和任务学习两种能力的竞争来促进上下文学习的出现,并提出了一种简单而有效的方法,在推理时间内更好地整合这两种能力。通过自适应集成学习,可以显著提高上下文学习的性能,使两个小模型的性能超过具有两倍参数的大模型
→
PDF
14 days ago
大型语言模型中的上下文翻译发生在哪里
通过层次上的上下文遮蔽实验,我们证明了大型语言模型中存在一个任务识别点,该点将任务编码到输入表示中,不再需要注意上下文,同时还观察到在层次遮蔽时的低性能与任务识别层之间的对应关系,利用这种冗余性可在提示 5 个示例时节省 45% 的计算量,
→
PDF
4 months ago
ACL
关于上下文学习的内容:“学习” 上下文中的任务识别和任务学习的区别
本研究探讨了大型语言模型利用情境学习来解决只有少量演示的任务的机制,发现情境学习从两个方面发挥作用:任务识别和任务学习,具有不同的性质和特点。
PDF
a year ago
Prev
Next