BriefGPT.xyz
大模型
Ask
alpha
关键词
task identity
搜索结果 - 5
基于提示池的逐步增加分类的对话状态跟踪
我们提出了一种使用提示池方法的持续学习方案,能够在测试中自动识别任务和选择适当的提示,并结合回放缓冲区进一步提高模型性能。
PDF
8 months ago
基于上下文、离线元强化学习的证明改进 —— 关注与对比学习
本文针对离线强化学习中的元学习问题,通过引入任务注意力机制和对比学习目标来提高任务表示的鲁棒性,从而改进了现有算法,并在多个元强化学习基准测试中展示了优越的性能和稳健性。
PDF
3 years ago
变分自编码器的对抗训练,用于持续的零样本学习(A-CZSL)
文章提出了一种基于 VAE 模块的连续零样本学习模型 (A-CZSL),用于解决人工神经网络与人类区别在于传统模型很难取得不同阶段任务良好的表现,模型大小在任务逐步增加的同时增长以防遗忘,并展示其在零样本学习和广义零样本学习上的优越性能。
PDF
3 years ago
持续学习的三种场景
本文提出三种不同的持续学习场景,探讨不同的评估方法以及其性能差异;通过研究表明,针对识别任务需要推断类别(即类别增量学习)的场景中,基于正则化的方法失败,需要回放以前经验的表示来解决此问题。
PDF
5 years ago
ICML
部分可观测下的深度分散式多任务多智能体强化学习
研究了多智能体下的多任务增强学习问题,提出了一种去中心化的单任务学习方法,并介绍了一种将单任务策略转化为适用于多个相关任务的统一策略的方法,无需明确标识任务身份。
PDF
7 years ago
Prev
Next