- CVPR基于门控的多分辨率传输网络用于爆发式图像修复和增强
本文介绍一种名为 GMTNet 的神经网络,它可以解决在一系列低质量的 burst 图像中的众多问题,包括通过多层次特征对齐和融合来生成高精度图像以及进行高质量的上采样。
- CVPR自监督视觉表示学习的多模式在线知识蒸馏
本文提出了一种多模在线知识蒸馏方法来提高自监督视觉表征学习,通过自蒸馏和交叉蒸馏两种蒸馏模式,实现了不同模型之间的知识交互,并通过跨注意力特征搜索策略增强了不同模型之间的语义特征对齐,实现了两个异构模型相互吸收知识以提高其表征学习性能。实验 - 提高开放词汇检测的特征对齐的三种方法
提出三种方法来解决零样本开放词汇检测中的视觉和文本特征对齐问题,其中包括改进的特征金字塔网络和检测头,自我训练方法以及使用更大的图像文本对语料库来改善检测性能,并在 LVIS 基准测试上获得了新的最优性能。
- 具有统一多粒度对齐的鲁棒领域自适应目标检测
该论文提出了一种基于多粒度对齐的检测框架,不仅考虑了不同类别实例之间的区别,还考虑了不同领域中不同粒度样本的区别,并采用自适应指数移动平均策略 for model assessment 来提高检测的鲁棒性。
- 基于语义的消息广播 —— 高效的非监督领域自适应
该研究提出了一种基于语义感知的信息广播方法,旨在提高视觉变压器在非分布式测试中的泛化能力,并在 DomainNet,OfficeHome 和 VisDA-2017 上进行了广泛的实验以证明其有效性。
- CVPR聚类到适应:在不同标签之间进行语义分割的少样本领域自适应
本研究提出了一种聚类适配方法 Cluster-to-Adapt(C2A),通过在转换的特征空间中强制执行聚类目标来选择源和目标域之间可以对齐的类别,从而实现分割数据集领域自适应的跨数据集分类适应。该方法在室内外语境场景下进行的少样本学习和零 - MM兼顾两种世界:面向领域的 Transformer 用于无监督领域自适应
提出了一种基于 Domain-Oriented Transformer 的无监督域自适应方法,通过在不同的领域中聚焦于不同的特征空间进行特征对齐,并为每个领域创建一个特定的面向域的分类器,该方法在多个基准测试中取得了最先进的效果。
- 面向开放域自适应的未知感知领域对抗学习
本文提出一种基于 Unknown-Aware Domain Adversarial Learning(UADAL)的开放领域适应方法,该方法在特征对齐过程中同时对齐源和目标已知分布,隔离目标未知分布,实现了特征对齐和目标未知类别的理论保证, - 基于混合类别分布度量的语义一致性特征对齐目标检测模型
该研究提出了一种基于混合类别 H 散度的 Semantic Consistency Feature Alignment Model(SCFAM),结合语义预测模型(SPM)和语义桥接组件(SBC)实现单类和多类特征的语义信息切分和对齐,以及 - 语义分割的无监督对比域自适应
通过对比学习实现特征对齐,提出了一种跨领域适应的标签扩展方法,结果表明,我们的方法在 Cityscapes 数据集上的表现始终优于最先进的方法。
- CVPR弱监督目标定位中分类和定位之间的填补
本研究提出了一个新的方法,通过特征方向的对齐来解决分类和定位之间的不匹配问题,实现了基于弱监督的目标定位的最先进性能。
- IJCAI图像文本检索:近期研究与发展综述
本文全面介绍了跨模态图像 - 文本检索的研究进展,包括特征提取、特征对齐、效率优化以及预训练,讨论了一些关键但较少被研究的问题,并对代表性方法进行了精度比较。
- CVPR重复使用教师分类器的知识蒸馏
使用简单的知识蒸馏技术可以显著缩小教师模型与学生模型之间的性能差距,通过使用预先训练的教师模型的判别分类器进行学生推断,并通过特征对齐训练学生编码器来实现与教师相同的性能。添加新的投影仪使学生编码器与教师分类器匹配,从而将这种技术应用于各种 - 伪标记中选择性的无监督多源自由领域自适应的优势
该研究提出了一种利用信息论界限和特征对齐技术,将目标数据划分为伪标记子集和无标记子集以实现平衡的无监督域自适应方法,取得了比现有方法更好的性能表现。
- 学习文本人物搜索的语义对齐特征表示
本文提出了一种基于语义对齐的嵌入方法,采用多头注意力模块和特征聚合网络进行特征对齐,以实现对于文本描述的行人图像搜索,并在 CUHK-PEDES 和 Flickr30K 数据集上取得了最先进的性能。
- KDDFed2:特征对齐联邦学习
本文提出了基于特征对齐 Fed2 的联邦学习框架,通过显式的特征分配和特征配对均值方案,解决了联邦学习过程中参数随机性造成的结构特征不匹配的问题,提高了模型的收敛性能。
- 面向原型的无监督领域自适应框架
提出了一种高效的概率框架,用于提取类别原型并将目标特征与其对齐,进而解决当前无监督域自适应方法中的采样可变性、类别不平衡和数据隐私问题,该方法适用于多种场景,包括单一源域,多源域,类别不平衡和源隐私域自适应,无需额外模型参数且计算量适中,在 - ICCV多实例孪生自监督表示学习用于自动驾驶
自主驾驶是一个备受关注的领域,但标记数据的收集过程非常困难,自监督学习可能是提高模型性能的一种有效方式。本文提出了一种名为 MultiSiam 的方法,解决了多示例情况下的自监督学习存在的问题,包括跨视图一致性和相似度度量。该方法在公开数据 - ICCVFaPN:基于特征对齐的金字塔网络用于稠密图像预测
本文提出了一种特征对齐模块和特征选择模块,用于上下文对齐上采样的高级特征,以及强调富有空间细节的低级特征,并将这两个模块集成在一个自上而下的金字塔结构中,形成了一种名为特征对齐金字塔网络(FaPN)的方法,该方法在四个密集预测任务和四个数据 - ICCV领域适配的语义聚焦
本文提出了一种基于对抗学习的语义集中方法(SCDA)用于解决领域自适应中的样本偏差和数据集标注问题,通过类别之间最大化样本预测分布的差异和最小化同一类别内不相似区域的特征差异来引导网络关注最主要的特征,SCDA 可作为一种常规方法集成到各种