- ICCV由视觉和视觉语言预训练引导的无源域自适应
灵活的源免领域自适应(SFDA)框架,通过融合预训练网络,提升了适应性能,并能成功整合现有的 SFDA 方法。
- 无需重新训练的鱼眼相机卷积神经网络适应
通过提出 Rectified Convolutions (RectConv) 方法,不需要任何重新训练即可将预训练卷积网络适应于新的非透视图像,从而实现对两个公开数据集中的鱼眼图像进行分割和检测。
- 通过辛共轭方法实现准确的导向扩散采样
Symplectic Adjoint Guidance (SAG) proposes a training-free guided sampling approach in diffusion models, improving accur - 音频视频领域的对比学习探索
通过对音频和视频模态的对比学习,研究表明预训练网络在音乐视频的标签和流派分类任务上优于对比学习方法,通过定性分析了解对比学习在音乐视频中的困难并提出未来工作的可能方向。
- ICLR水印图像在 ImageNet 中的危险
本文探讨了预训练网络在 ImageNet 数据集中学习水印模式的情况,发现不止卡通类别受到影响,还有诸如显示器、扫帚、围裙和保险箱等类别。最后,提出了一个简单的方法来缓解这个问题。
- 使用 Wav2vec2 和 Whisper 进行演讲者和语言变更检测
通过向标签添加说话者(变化)或语言目标,我们研究了最近为自动语音识别预训练的 transformer 网络对检测语音中的说话者和语言变化的能力。对于 Wav2vec2 预训练网络,我们还研究了是否可以调节说话者变化符号的表示以捕获说话者身份 - 自动驾驶感知减少过度自信的预测
本文探讨了基于概率的方式,采用已预训练网络的 Logit 层得分计算分布来进行物体识别,表明与 SoftMax 和 Sigmoid 相比,最大似然和最大后验函数更适合进行这种概率化解释,实现了良好的性能和可解释性。同时,由于这种方法可以在现 - 利用现有的深层网络进行字幕和美学引导的图像裁剪
我们提出了一种新颖的优化框架,它可以基于用户描述信息和美学目标对给定图像进行裁剪,通过重新利用预训练的图像标注和美学任务网络直接优化裁剪参数,并通过多种策略实现了优化目标的实现,定量与定性实验证明我们的框架可以产生符合预期的用户描述和审美标 - CVPRTransformaly -- 一藏俩器(特征空间)胜于一
本研究提出了一种称为 Transformaly 的方法,利用预先训练的网络(ViT)提取特征向量,并使用教师 - 学生训练方法将训练数据中的正常样本提供给学生网络进行训练,从而在异常检测方面实现了超越最新技术的结果。
- 从多样化的物体场景组合中的零样本行为识别
本研究提出了基于物体和场景组成误差与多样性要求的无监督零样本动作识别方法,该方法不需要已训练的视频集,能够有效地提高动作识别效果。
- 使用连续标记界面集成预训练网络进行端到端口语理解
本文提出了一种简单而健壮的端到端 SLU 模型所需的连续 Token 接口(CTI),从而使 ASR 和 NLU 网络获得网络集成。 在确保仅使用预训练的网络时,我们在 E2E 方式下训练 SLU 网络,并在多任务学习下对异构数据进行培训, - 余弦相似度与 softmax 结合:视觉定位难以超越的基线模型
本文提出了一种在多个图像 ROI 特征和文本嵌入之间的余弦距离上最小化交叉熵损失来实现自动驾驶视觉定位的简单方法,使用预训练网络获得初始嵌入,同时实验结果表明比采用精细注意机制或复杂度损失函数的方法表现更优,AP50 准确率达到 68.7% - 通过潜在空间映射的人脸身份分离
本文提供了一种使用预训练网络来学习数据的解缠表示的方法,以实现最小的监督,同时展示了该方法在头部图像领域上成功将身份从其他面部属性中解缠并显示出较好的评估结果。
- MetaIQA: 无参考图像质量评估的深度元学习
本文提出了一种基于深度元学习的无参考图像质量评估指标,通过收集多种失真的图像任务,在元学习的基础上,学习人类评估图像质量时所共享的元知识,以适应未知的失真,进而优化质量先验模型,进行目标无参考图像质量评估,结果表明这种方法优于现有技术,并且 - IJCAI神经网络可解释性的解释掩码
本研究提出通过次级神经网络生成解释性掩码的方法,以解释预训练的神经网络预测中的重要因素,通过在保留较高预测准确性的同时生成最小的解释。该方法在卷积神经网络的图像分类、循环神经网络的情感分析以及混合卷积神经网络 / 循环神经网络的化学属性预测 - ICCV通过自适应知识融合从异质教师中定制学生网络
本篇文章探讨了如何利用预先训练好的深度网络来训练一个个性化的学生网络,以解决用户选择的任务,文章提出了一种双步骤策略,其中第一步从具有相同子任务的异构教师中提取任务特定知识,然后将提取的知识混合,来构建学生网络,以自我的方式从带有最小预测模 - IJCAI通过共同特征学习从异构网络中融合知识
本研究使用预先训练的网络作为示范,旨在学习一种能够整合各种异构结构教师的多才多艺、轻量级的学生模型,而无需获取任何人工注释信息。为此,提出了一种通用的特征学习方案,所有教师的特征都被转换成共同的空间,并且要求学生模型模仿他们的所有特征,以使 - IJCAI综合过滤知识:从多任务教师中学习定制化学生
该论文提出了一种基于预训练卷积神经网络的教师 - 学生学习方法,通过多个教师的知识筛选和层次式训练策略,将目标学生网络定制到不同任务,从而在多项基准测试中实现了优异结果。
- CVPR用于高效任务分类和迁移学习的表示相似性分析
本文提出通过使用 RSA 方法评估不同任务和其特定模型之间的关系来实现任务分类,进而用少量图像和预训练模型来展示此方法在生成 Taskonomy 数据集的任务分类方面的有效性和效率,并展示了在与 Pascal VOC 语义分割等任务中转移学 - Dynamic-Net: 无需重新训练即可调整目标函数的综合任务
该论文提出了 Dynamic-Net 的概念,这是一种可以在推断时被修改的结构,它利用目标空间中的所有线性组合来改进预训练网络的性能。这种方法是快速的,且允许用户实时交互式修改网络,以获得所需结果。