关键词visual classification tasks
搜索结果 - 6
- 用于高效视觉分类的 Spikformer 中傅立叶或小波基作为对应的自注意力
使用峰值傅立叶变换、小波变换及其组合替代传统的自注意力机制,提出了基于峰值或小波的 spikformer(FWformer),在视觉分类任务中验证并表明其能够达到可比甚至更高的准确性(0.4%-1.5%),更快的运行速度(训练速度提高 9% - AAAI通过生成对抗网络推进预先解释模型
该论文提出了一种新颖的概念学习框架,用于增强视觉分类任务中模型的可解释性和性能,通过将非监督解释生成器附加到主分类器网络中,并利用对抗训练的方式,使模型从潜在表征中提取视觉概念并与人可解释的视觉属性隐式对齐,该方法的实验结果验证了其稳健性和 - 唤醒 - 睡眠综合学习
利用 “Wake-Sleep Consolidated Learning” 学习策略,结合互补学习系统理论和人脑清醒 - 睡眠阶段,提高深度神经网络在连续学习环境下进行视觉分类任务的性能。
- 用于合成、隐私和去除的切向变换器
介绍一种基于 Tangent Attention Fine-Tuning (TAFT) 的方法,通过对预先训练的初始化进行一阶泰勒展开的计算得到线性化的 transformers,从而使得线性化所得的 Jacobian-Vector Pro - CLIP-Adapter: 特征适配器提升视觉语言模型
本文提出一种新的视觉语言模型 fine-tuning 方式 ——CLIP-Adapter,通过在原训练模型上加入新特征层并进行残差式混合来实现,在各种视觉分类任务中表现优异,优于 context optimization
- 多个视觉任务的迭代掌握:网络自然地学习学习和遗忘遗忘
我们研究了卷积神经网络在连续学习环境中的行为,通常是按顺序引入视觉分类任务并要求网络在掌握以前学习的任务的同时掌握新任务。我们发现,在涉及十个相关视觉任务的模拟中,前向促进随着 n 的增加而增加,而向后干涉则随 n 的增加而减少。这可以通过