BriefGPT.xyz
Ask
alpha
关键词
efficient adaptation
搜索结果 - 4
TAIL:大型预训练模型的任务专用适配器用于模仿学习
TAIL 框架通过使用 LoRA 技术实现对大型预训练模型的高效适应,其在新任务中只使用了 1% 的可训练参数,避免了灾难性遗忘并保持了持续学习环境中的适应能力。
PDF
9 months ago
应用于复合材料热压处理的连续元迁移学习(SMT)以应对物理信息神经网络的复杂性
通过提出一种新颖的顺序元迁移学习框架,将物理导向神经网络(PINN)分解 PDE 的时间域以创建适用于 PINN 训练的较小时间段的 “较简单” 问题,并通过元学习器在各个时间间隔上进行训练,以实现快速适应各种相关任务的最佳初始状态,并借助
→
PDF
a year ago
CVPR
DRESS:动态实时稀疏子网络
本文提出了一种名为 DRESS 的新型训练算法,用于从同一主干网络中通过基于行的非结构稀疏性采样多个子网络,并通过加权损失并行训练这些子网络,以及利用参数重用和基于行的精细采样策略来实现高效存储和设备适应。在公共视觉数据集上的大量实验证明,
→
PDF
2 years ago
ICML
多智能体强化学习中的学习学习策略梯度算法
本研究提出了一种新的元多智能体策略梯度定理,该定理直接考虑到多智能体学习环境中固有的非稳态策略动态,并通过建模梯度更新以考虑智能体自身的非稳态策略动态以及环境中其他代理的非稳态策略动态来达成。在多种多智能体基准测试中,我们的方法能够在全谱的
→
PDF
4 years ago
Prev
Next