WIDIn：面向单源域泛化的领域不变表示的词语图像

May, 2024

WIDIn：面向单源域泛化的领域不变表示的词语图像

WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization

Jiawei Ma, Yulei Niu, Shiyuan Huang, Guangxing Han, Shih-Fu Chang

TL;DR通过使用自我监督框架 WIDIn 并结合细粒度对齐的语言嵌入方式，实现了去除视觉表示中的领域特定成分，从而提供了一种可以应用于预训练的视觉 - 语言模型以及单模态模型的方法。在三个领域通用数据集上进行的实验验证了我们方法的有效性。

Abstract

language has been useful in extending the vision encoder to data from diverse distributions without empirical discovery in training domains. However, as the image description is mostly at coarse-grained level and

language vision encoder self-supervision domain-invariant representation domain generalization

发现论文，激发创造

一句话描绘千张画面：通过语言指导提炼 CLIP 进行领域泛化

通过引入视觉 - 语言模型进行知识蒸馏，本文提出了一种新的域泛化方法，称为 RISE (Regularized Invariance with Semantic Embeddings)，并通过在多个基准数据集上的实验证明其在域泛化方面的优越性。

Sep, 2023

WEDGE: 基于 Web 图像辅助的领域泛化语义分割

本文提出了一个 WEb-image assisted Domain GEneralization (WEDGE) 方案，利用网络爬取的数据集进行语义分割的域泛化，将网络爬取的数据代表的样式表达引入源域，通过有效训练使网络经历不同风格的图像，通过使用带有伪标签的网络爬取数据集训练可以进一步提高网络的能力，并通过广泛的实验表明，该方法明显优于现有的域泛化技术。

Sep, 2021

图像智能描述技术研究与应用

通过精细图像描述训练视觉语言模型的框架和数据集的介绍，验证了其在数据质量和与先前工作的比较中的优势，并展示了模型在生成最接近原始图像的描述以及在多个数据集上的表现优势。

May, 2024

利用文本为视觉表示建立通用领域基础

本文提出了一种基于自然语言监督的跨模态领域泛化方法，利用视觉和文本交互的表征来实现高级别类别判别的信息融合，并使用可解释的模型来生成解释，从而提高模型的泛化能力和性能。作者的方法在多个数据集上均取得了最新领先的结果。

Jul, 2022

在潜在空间中通过领域不变表示学习改善入侵检测

通过多任务学习，我们引入了一种两阶段表示学习技术，旨在从跨越多个领域的特征中培养一个潜在空间，包括原始和跨领域的特征，以增强在未见过的内部分布和外部分布领域的推理能力。此外，我们试图通过最小化先验和潜在空间之间的互信息来解耦潜在空间，从而有效地消除虚假特征之间的关联性。总体而言，这种联合优化将促进领域无关的特征学习。我们使用标准分类指标在多个网络安全数据集上评估模型的有效性，并将结果与当代领域泛化方法进行对比。

Dec, 2023

无监督多领域多模态图像到图像转换与显式领域约束解耦

本文提出了一个使用无成对训练数据和单个网络同时训练不同域的多个数据集来学习生成多样化输出的统一框架，并研究了如何更好地提取域监督信息以学习更好的分离表征和实现更好的图像翻译的方法。实验表明，所提出的方法优于或与最先进的方法相当。

Nov, 2019

基于聚类的图像 - 文本图匹配模型桥接领域差距

通过融合图像和文本的多模态图形表示，我们通过考虑图像和文本描述符之间内在的语义结构得到领域不变的关键嵌入，从而实现领域泛化问题中的域不变特征学习。我们的模型在 CUB-DG 和 DomainBed 等大规模公共数据集上实验，取得了与或更好于这些数据集上的最新性能。

Oct, 2023

领域不变图像表示的高效学习

本文介绍了一种能够有效地实现为线性分类器的学习表示算法，该算法能够明确地补偿域不匹配，并在训练分类器的过程中形成从目标（测试）域到源（训练）域的线性转换。通过多类别适应的表示学习，能够在异构特征空间之间进行映射，并且可以扩展到大型数据集。在几个图像数据集上的实验结果表明，与之前的方法相比，提高了准确性并具有计算上的优势。

Jan, 2013

领域自适应的图像到图像翻译

提出了一种无监督域适应的通用框架，利用添加额外的网络和损失函数，通过使用图像翻译框架和特征提取实现在无需目标域训练数据的情况下，测试源域训练的深度神经网络在不同的目标域上的能力，并在分类和分割任务上，应用于 MNIST、USPS、SVHN 和 Amazon、Webcam、DSLR Office 以及 GTA5 和 Cityscapes 数据集，取得了最先进的性能。

Dec, 2017

基于分离表征的多样化图像翻译

该研究提出了一种基于解缠表示的方法，用于在无成对的训练图像的情况下产生多样化的输出，在领域适应方面具有竞争性表现，并且在多种任务上可以生成多样化与逼真的图像。

Aug, 2018