BriefGPT.xyz
Ask
alpha
关键词
hierarchical memory
搜索结果 - 3
FragRel: 大型语言模型外部存储中利用片段级关系
利用片段级别关系来处理长文本,通过引入基于关系的片段评估标准以及基于片段连接的分层记忆的大型语言模型,提高了长篇故事理解、代码生成和长期对话的性能。
PDF
2 months ago
SPARTAN:用于参数高效的 Transformer 的稀疏分层存储器
本研究提出了一种基于 SPARTAN 的架构,在使用预训练语言模型的基础上,仅对其记忆进行微调,以显着减少存储和计算成本,从而适用于存储受限的边缘设备,并通过使用分层组织的稀疏内存以及其他架构优化,在不损失性能的情况下提高了其执行效率。
PDF
2 years ago
跨域 Few-shot 学习的分层变分记忆
本研究提出了一种基于分层原型模型和层次内存的神经记忆方法,该方法能够在领域转移的情况下,灵活地依赖不同语义层面的特征来适应新任务,而数据驱动的学习方法进一步可以使模型自适应地选择最具通用性的特征。该方法通过大量消融实验验证了性能的显著提升,
→
PDF
3 years ago
Prev
Next