- 无语言稀缺和噪音通道的免费领域适应话者验证
本文研究了在语音验证中,源数据不可访问及目标数据集非常有限的情况下,无源领域适应技术的应用。同时研究了源数据与目标数据之间的语言和通道不匹配问题,并评估比较了不同大小标记目标数据集的微调方法,还对无标签目标数据集进行了基于迭代式聚类学习算法 - 生成式人工智能中的版权保护:技术视角
从技术角度综述了版权保护,包括数据源权利保护和生成模型版权保护,探讨了数据所有者保护内容和合法利用 DGMs 的方法,以及防止模型盗取和识别特定模型生成结果的策略。同时,强调了现有技术限制和待开发领域,并讨论了版权保护对 Generativ - 再生学习:一种数据生成的学习范式
本文介绍了一种称为再生学习的学习范式,将表示学习的概念扩展到数据生成任务,使用 Y' 进行数据生成。再生学习作为传统表示学习的对应物,可以广泛应用于数据生成,并且可以为开发数据生成方法提供有价值的见解。
- 基于动物交流理解的无监督翻译理论
我们提出了一个理论框架,用于分析无平行数据可用且源语料库与目标语料库不相干或具有相似语言结构时的 UMT,并且研究表明翻译准确性取决于源语言的复杂性和源语言与目标先验之间的 “共同基础”。
- 对抗样式增强用于领域泛化城市场景分割
本文提出 Adversarial Style Augmentation 方法来解决语义分割中的领域通用性问题,其通过在训练过程中动态生成样式强化的图像,以有效地避免模型过度拟合于源域,并且在两个合成 - 真实语义分割基准测试数据集上进行实验 - 听取、适应、提高 WER:源自由单语音时自适应用于自动语音识别
该研究提出了单次话语测试时间自适应(Single-Utterance Test-time Adaptation,SUTA)框架,首次将测试时间自适应(TTA)应用于语音识别,通过无监督目标和高效的适应策略,有效提高源 ASR 模型在多个域外 - 无监督微调
本文研究了无监督微调的问题,提出了两种简单有效的策略来将源数据和目标数据进行组合以实现更好的传递性能。通过在多个不同的目标数据集上进行广泛的实验,表明了所提出的 “无监督微调” 策略比朴素策略具有更好的传递性能。
- 领域印象:一种无需源数据的领域自适应方法
该论文提出了一种无需源数据的领域自适应技术,其基于生成式框架,使用来自源类的分类器生成样本,并使用神经能量网络训练联合分布,在此极为新颖的场景中取得了比基准模型更好的结果。
- 无需源数据的无监督领域自适应
该研究提出了一种针对亮度、对比度等自然变化轴的目标域适应方法,只需要无标签的目标数据和源分类器,有效地解决了预训练模型中源数据不可用的问题,并表明其在有限标记数据的情况下胜过微调基线。
- 迁移学习中目标数据的价值
研究如何在迁移学习中最小化取样成本,并建立了源数据和目标数据样本大小的最小最大速率,并展示了性能限制是通过源与目标之间的不一致性捕捉的,我们称之为转移指数。
- CVPR负迁移的特征及其避免
研究传输学习中不同源数据对目标任务的影响,提出了负传输的正式定义,并通过对抗网络设计了一种过滤无关源数据的技术,用于解决负传输问题,在实验中该方法能够显著提高基线方法的性能并避免负面影响。
- 非常简单的领域适应
本文介绍了一种域自适应方法,适用于有足够 “目标” 数据的情况下,可以比仅使用 “源” 数据更好地适应;这种方法非常简单,易于实现,可用作预处理步骤,并在一系列数据集上优于现有方法;此外,它可以轻松地扩展到多域自适应问题,其中有来自不同领域