BriefGPT.xyz
大模型
Ask
alpha
关键词
composite tasks
搜索结果 - 4
MeteoRA: 用于大型语言模型的嵌入式 LoRA 多任务系统
在本研究中,我们介绍了 extbf {MT-LoRA}(多任务嵌入 LoRA),这是一个可扩展的多知识 LoRA 融合框架,旨在用于大型语言模型(LLMs)。MT-LoRA 通过混合专家(MoE)的方式将各种 LoRA 适配器集成到基本 L
→
PDF
a month ago
ICLR
神经比例定律的资源模型
神经缩放定律表征了模型性能随模型规模增加的改善情况。我们提出了一个神经缩放的资源模型,通过将任务分解为多个子任务并为其分配神经元资源(以分配给子任务的神经元数量表示),我们在玩具问题上经验证实以下实验发现:(1)子任务的损失与其分配的神经元
→
PDF
5 months ago
PGDiff:通过部分引导指导扩散模型进行多功能人脸还原
利用预训练扩散模型进行恢复已成为传统特定任务训练方法的可取替代。本文提出了 PGDiff,通过引入部分指导的新视角,相较于现有方法更适应现实世界中的退化过程。我们的方法不是具体定义退化过程,而是模拟高质量图像的图像结构和颜色统计等期望特性,
→
PDF
9 months ago
使用图神经网络的结构化分层对话策略
通过引入计算图神经网络,本文提出了可用于解决餐厅预订等复合型任务的层次式深度强化学习新方法,并在实验中展示其相较于传统方法更高的采样效率、更好的噪声抵抗力和更好的模型迁移性能。
PDF
4 years ago
Prev
Next