BriefGPT.xyz
大模型
Ask
alpha
关键词
routing functions
搜索结果 - 3
基于张量积的专家混合模型
在多任务学习中,我们提出了一种新的模块化语言模型(TensorPoly),它通过精细的路由方法和参数效率平衡来减轻负面干扰,并通过高效的自适应方法在多任务迁移学习中取得更好的结果。
PDF
a month ago
引入路由功能以低秩瓶颈优化视觉语言参数高效微调
针对视觉 - 语言(VL)任务的参数高效微调方法,使用名为路由函数的操作在低秩瓶颈中增强了 VL 对齐,极大地改善了原始 PEFT 方法在各种 VL PEFT 设置中的表现,包括 20% 的提升(在 VQAv2 上)和 30% 的提升(在
→
PDF
4 months ago
CVPR
细粒度视觉分类的注意力卷积二元神经树
本文提出了一种基于关注的卷积二叉神经树框架,并使用路由功能、注意力变换器模块以及负对数似然损失函数等处理技术来解决细粒度视觉分类中遇到的问题,在多个标准数据集上的实验结果表明该方法性能优于先前提出的方法。
PDF
5 years ago
Prev
Next