面向通用零样本学习的领域感知视觉偏差消除

CVPRMar, 2020

面向通用零样本学习的领域感知视觉偏差消除

Domain-aware Visual Bias Eliminating for Generalized Zero-Shot Learning

Shaobo Min, Hantao Yao, Hongtao Xie, Chaoqun Wang, Zheng-Jun Zha...

TL;DR该论文提出了一种新的基于领域感知的视觉偏见消除网络（DVBE），该网络构建了两种互补的视觉表示，即无语义和有语义。实验结果表明，DVBE 相比现有方法，平均提高了 5.7％的性能表现。

Abstract

Recent methods focus on learning a unified semantic-aligned visual representation to transfer knowledge between two domains, while ignoring the effect of semantic-free →

domain-aware visual bias eliminating semantic-aligned semantic-free visual representation domain detection

发现论文，激发创造

BEV-DG: 基于鸟瞰图的跨模态学习用于 3D 语义分割领域泛化

跨模态无监督领域自适应旨在利用二维 - 三维数据的互补性来克服新领域中缺乏注解的问题。本研究提出了基于鸟瞰图的跨模态学习方法，用于三维语义分割的领域泛化。通过鸟瞰图下的交叉模态学习，优化了与领域无关的表示建模，同时提出了鸟瞰图驱动的领域对比学习方法来建模领域无关的表示。在三个三维数据集上，BEV-DG 在所有设置中明显优于现有方法，差距显著。

Aug, 2023

面向鸟瞰视角的多视角三维物体检测领域泛化

本论文提出了一种名为 DG-BEV 的方法，通过将同态转换的测度深度预测转换为尺度不变深度来获得强健的深度预测，并使用单应性进行动态透视增强以增加外参参数的多样性，并通过多个伪域值修改对抗性训练损失来构建特征表示，从而显著减轻了目标领域的性能下降。

Mar, 2023

DA-BEV：无监督领域自适应鸟瞰视觉感知

DA-BEV 是第一个通过利用图像视图特征和 BEV 特征之间的互补性来解决域自适应 BEV 挑战的域自适应基于相机的 BEV 框架，引入了查询的概念，通过查询来从图像视图和 BEV 特征中推导有用的信息，通过查询引导对方的自适应，经过大量的实验，DA-BEV 在多个数据集和任务（如 3D 目标检测和 3D 场景分割）中持续实现了卓越的域自适应 BEV 感知性能。

Jan, 2024

统一深度监督域自适应和泛化

本文提出了一个视觉监督领域适应和泛化深度模型的统一框架，利用孪生网络结构来学习判别性嵌入子空间，通过点对代理的分布距离和相似性来解决少量目标数据样本标注的情况下，语义概率分布的对齐与分离问题。研究表明该方法在快速自适应方面的优势表现出来，并且只需要极少量的标注目标训练样本，甚至每个类别仅需一个标注样本就可以发挥有效性。此外，该方法还可扩展到领域泛化，并且实验证明该方法在两个应用领域都有很好的效果。

Sep, 2017

基于提示的零样本策略转移中的视觉对齐

通过 prompt-based visual alignment (PVA) 框架中的语义信息作为显式约束，可以缓解图像中的有害领域偏见，实现零次策略转移，并在有限域数据的情况下实现跨领域学习。

Jun, 2024

ViG-Bias: 视觉基础偏见发现与缓解

通过整合视觉解释力量，本研究提出了一个名为 Visually Grounded Bias Discovery and Mitigation (ViG-Bias) 的简单而高效的技术，并通过全面评估证明其对现有的 DOMINO、FACTS 和 Bias-to-Text 等技术的性能提升，在包括 CelebA、Waterbirds 和 NICO++ 在内的多个具有挑战性的数据集上都取得了成功。

Jul, 2024

双向分布对齐用于跨领域归纳零样本学习

该论文提出了一种名为 Bi-VAEGAN 的模型，通过增强视觉和辅助空间之间的分布对齐来大大改善了领域转移的问题，在使用四个数据集进行基准评估时，在标准和普遍的 TZSL 设置下均达到了最新的艺术水平。

Mar, 2023

学习鲁棒的视觉 - 语义嵌入

该研究提出了一种基于无监督学习和深度神经网络的终端到终端学习框架，结合自编码器和最大均值差异损失来学习语义和视觉特征的联合嵌入，实现了跨域多模态表示的提取，并构建了更全面的标记和未标记数据的嵌入，帮助从归纳到传导的范围内解决零样本和少样本图像识别和检索等各种复杂任务。

Mar, 2017

领域特定的嵌入网络用于零样本识别

提出了一种基于领域特定嵌入网络（DSEN）的零样本学习方法，通过将图像数据和语义标签投影到联合嵌入空间中进行识别，该方法分解了领域共享投影函数并使用领域特定子函数探索领域的相似性和差异性，同时引入语义重构和领域划分约束以解决偏倚问题和保持语义关联。实验表明，DSEN 在四个公共基准测试中具有显著的改进。

Aug, 2019

HSVA: 分层语义视觉自适应用于零样本学习

本文提出了一种新的分层语义视觉适应（HSVA）框架，其中采用两步适应（结构适应和分布适应）来将语义和视觉领域对齐，本文在四个基准数据集上进行了广泛的实验，证明 HSVA 在常规 ZSL 和广义 ZSL 中都表现出优越的性能。

Sep, 2021