BriefGPT.xyz
Ask
alpha
关键词
multi-task generalization
搜索结果 - 3
InstructEdit:用于大型语言模型的指令基础知识编辑
大规模语言模型的知识编辑可以提供一种有效的解决方案,以改变模型的行为而不会对整体性能产生负面影响。为了解决当前方法在任务上的有限泛化能力的问题,我们采取了第一步来分析知识编辑中的多任务泛化问题。具体而言,我们开发了一种基于指令的编辑技术,称
→
PDF
4 months ago
ChatPLUG: 面向数字人类的开放领域生成对话系统,利用互联网增强的指令调整
本文介绍了 ChatPLUG:一个用于数字人类应用的中文开放域对话系统,通过互联网增强的指导微调在统一的互联网增强格式中针对广泛的对话任务。在多个任务上进行指导微调,集成外部知识的互联网搜索,从而表现出良好的多任务泛化性能,并在真实世界应用
→
PDF
a year ago
ICLR
通过从数据集学习生成图形实现快速神经架构搜索
本文提出了一种高效的神经架构搜索(Neural Architecture Search, NAS)框架,基于元学习的跨模态潜空间,结合预训练的网络库和数据库,可以快速地为新数据集搜索神经架构,并且还提出了一种元性能预测器来从多个未见数据集中
→
PDF
3 years ago
Prev
Next