DASA：面向说话人验证的难度感知语义增强

Oct, 2023

DASA：面向说话人验证的难度感知语义增强

DASA: Difficulty-Aware Semantic Augmentation for Speaker Verification

Yuanyuan Wang, Yang Zhang, Zhiyong Wu, Zhihan Yang, Tao Wei...

TL;DR通过围绕发音人嵌入空间中的语义方向对训练样本进行扰动，使用鲁棒性发音人嵌入来估计准确的协方差矩阵，并推导出了预期损失的闭式上界，该研究提出了一种新颖的难度感知的语义扩增方法，能够在几乎没有额外计算成本的情况下产生多样化的训练样本，取得了令人瞩目的性能改进。

Abstract

data augmentation is vital to the generalization ability and robustness of deep neural networks (DNNs) models. Existing augmentation methods for speaker verification manipulate the raw signal, which are time-cons

data augmentation deep neural networks speaker verification semantic augmentation speaker embeddings

发现论文，激发创造

对抗数据增强用于鲁棒的说话人验证

本文提出了一种名为对抗数据增强（A-DA）的新方法，将数据增强与对抗学习相结合，通过额外的分类器对不同类型的增强进行分类，使得网络能够生成能够欺骗分类器的说话者嵌入，从而提升模型对于增强变化的鲁棒性和泛化能力。在 VoxCeleb 和 CN-Celeb 数据集上的实验证明了我们提出的 A-DA 方法在匹配和不匹配的测试条件下均优于标准数据增强方法，展示了其对于声学变化的卓越鲁棒性和泛化能力。

Feb, 2024

语义数据增强正则化深度网络

提出一种基于深度神经网络学习的语义数据增强方法 (ISDA), 通过此方法可以提高卷积神经网络在图像分类任务上的泛化性能.

Jul, 2020

深度网络的隐式语义数据增强

该论文提出了一种新颖的隐式语义数据增强（ISDA）方法，通过在线估计每个类别的深度特征协方差矩阵并在特征空间中沿着许多语义方向平移训练样本来有效增强数据集以提高泛化性能，并提出了一个新颖的鲁棒 CE 损失函数，实现了在多个数据集上对 ResNets 和 DenseNets 等流行的深度模型的一致性提高的效果。

Sep, 2019

虚拟数据增强：一种用于微调预训练模型的稳健通用框架

该论文提出了一种名为 Virtual Data Augmentation（VDA）的数据增强技术，通过基于原始令牌嵌入构建混合多项式来增加语义相关且具有充分多样性的虚拟数据嵌入，其中掩码语言模型保证了语义相关性，高斯噪声提供增强的多样性，并提出了一种规则化训练策略以平衡两个方面，大量实验证明该方法能提高 pre-trained language models 的鲁棒性和减轻对对抗攻击的表现下降。

Sep, 2021

低资源开放领域对话生成的可控且多样化的数据增强

利用大规模语言模型 (LLM) 进行以摘要为基础的对话增强 (SDA) 以提高语义多样性和控制能力，通过生成高质量和多样化的对话数据来增强开放领域对话模型的性能。

Mar, 2024

对抗性语义数据增强用于人体姿态估计

提出了基于语义数据增强和对抗学习的人体姿势估计方法，在应对外观对称性、严重遮挡和近距离干扰等多种挑战性情况下，取得了最先进的结果。

Aug, 2020

面向发音障碍和老年人的个性化对抗性数据增强语音识别

本文提出使用基于 GAN 的数据增强方法，通过分析非标准语音（如老年人和 dysarthric 患者的语音）的光谱和时间差异可模拟增强数据，提高了 UASpeech、TORGO、Pitt 和 JCCOCC MoCA 等数据集上 TDNN 和 Conformer ASR 系统的训练精度，相对于基于速度的数据增强方法，可使 TORGO 和 DementiaBank 数据集的 WER 分别提高 9.61％和 6.4％。

May, 2022

口语中老年痴呆症检测的数据增强

本文通过数据增广方法研究痴呆症检测任务，并在两种建模方式中进行实证评估，结果表明数据增广可提高文本和音频领域的性能。

Jun, 2022

对话人工智能的数据增强

对话系统中的数据扩充方法提供了关键的方法来解决数据稀缺问题，并探讨了对话系统中的生成、评估等任务中的挑战与未来方向。

Sep, 2023

基于贝叶斯的随机语义数据增强在医学图像分类中的应用

提出了一种名为 Bayesian Random Semantic Data Augmentation 的新型、高效且即插即用的语义数据增强方法（BRSDA），通过在特征空间中沿特定方向进行简单的平移，实现语义转换，并结合其他主流的数据增强方法，取得了优越的性能。

Mar, 2024