面向通用零样本学习的领域感知视觉偏差消除
跨模态无监督领域自适应旨在利用二维 - 三维数据的互补性来克服新领域中缺乏注解的问题。本研究提出了基于鸟瞰图的跨模态学习方法,用于三维语义分割的领域泛化。通过鸟瞰图下的交叉模态学习,优化了与领域无关的表示建模,同时提出了鸟瞰图驱动的领域对比学习方法来建模领域无关的表示。在三个三维数据集上,BEV-DG 在所有设置中明显优于现有方法,差距显著。
Aug, 2023
本论文提出了一种名为 DG-BEV 的方法,通过将同态转换的测度深度预测转换为尺度不变深度来获得强健的深度预测,并使用单应性进行动态透视增强以增加外参参数的多样性,并通过多个伪域值修改对抗性训练损失来构建特征表示,从而显著减轻了目标领域的性能下降。
Mar, 2023
DA-BEV 是第一个通过利用图像视图特征和 BEV 特征之间的互补性来解决域自适应 BEV 挑战的域自适应基于相机的 BEV 框架,引入了查询的概念,通过查询来从图像视图和 BEV 特征中推导有用的信息,通过查询引导对方的自适应,经过大量的实验,DA-BEV 在多个数据集和任务(如 3D 目标检测和 3D 场景分割)中持续实现了卓越的域自适应 BEV 感知性能。
Jan, 2024
本文提出了一个视觉监督领域适应和泛化深度模型的统一框架,利用孪生网络结构来学习判别性嵌入子空间,通过点对代理的分布距离和相似性来解决少量目标数据样本标注的情况下,语义概率分布的对齐与分离问题。研究表明该方法在快速自适应方面的优势表现出来,并且只需要极少量的标注目标训练样本,甚至每个类别仅需一个标注样本就可以发挥有效性。此外,该方法还可扩展到领域泛化,并且实验证明该方法在两个应用领域都有很好的效果。
Sep, 2017
通过 prompt-based visual alignment (PVA) 框架中的语义信息作为显式约束,可以缓解图像中的有害领域偏见,实现零次策略转移,并在有限域数据的情况下实现跨领域学习。
Jun, 2024
通过整合视觉解释力量,本研究提出了一个名为 Visually Grounded Bias Discovery and Mitigation (ViG-Bias) 的简单而高效的技术,并通过全面评估证明其对现有的 DOMINO、FACTS 和 Bias-to-Text 等技术的性能提升,在包括 CelebA、Waterbirds 和 NICO++ 在内的多个具有挑战性的数据集上都取得了成功。
Jul, 2024
该论文提出了一种名为 Bi-VAEGAN 的模型,通过增强视觉和辅助空间之间的分布对齐来大大改善了领域转移的问题,在使用四个数据集进行基准评估时,在标准和普遍的 TZSL 设置下均达到了最新的艺术水平。
Mar, 2023
该研究提出了一种基于无监督学习和深度神经网络的终端到终端学习框架,结合自编码器和最大均值差异损失来学习语义和视觉特征的联合嵌入,实现了跨域多模态表示的提取,并构建了更全面的标记和未标记数据的嵌入,帮助从归纳到传导的范围内解决零样本和少样本图像识别和检索等各种复杂任务。
Mar, 2017
提出了一种基于领域特定嵌入网络(DSEN)的零样本学习方法,通过将图像数据和语义标签投影到联合嵌入空间中进行识别,该方法分解了领域共享投影函数并使用领域特定子函数探索领域的相似性和差异性,同时引入语义重构和领域划分约束以解决偏倚问题和保持语义关联。实验表明,DSEN 在四个公共基准测试中具有显著的改进。
Aug, 2019
本文提出了一种新的分层语义视觉适应(HSVA)框架,其中采用两步适应(结构适应和分布适应)来将语义和视觉领域对齐,本文在四个基准数据集上进行了广泛的实验,证明 HSVA 在常规 ZSL 和广义 ZSL 中都表现出优越的性能。
Sep, 2021