PosCUDA: 基于位置的卷积用于无法学习的音频数据集
本文提出了一种新的模型无关的基于卷积的不可学习数据集生成技术:CUDA,可以有效增强深度学习模型的鲁棒性;实验结果表明,CUDA 对数据扩充、训练方法等的鲁棒性较强,并且为了保证模型的数据隐私性,该技术是可靠的。
Mar, 2023
通过随机的乘法变换和插值操作,我们成功地提出了一种抵御基于卷积的无法学习数据集的全新图像破坏方法,有效地抑制了基于卷积的无法学习数据集中的乘法噪声的影响,并且在实验证明我们的方法对于这种类型的数据集是最有效的。
Nov, 2023
本文介绍了一种通用的框架,用于在没有监督的情况下对深度网络进行端对端训练,通过固定一组目标表示并约束其深度特征对齐到这些表示来达到目的,同时采用了随机批量重新分配策略和可分离的平方损失函数来缓解标准无监督学习中的一些问题,并且在 ImageNet 和 Pascal VOC 上能够实现与最先进的无监督方法相媲美的表现。
Apr, 2017
我们研究和设计了一个有效的非线性转换框架,并进行了广泛实验以证明深度神经网络可以有效地学习以往被认为是无法学习的数据 / 示例,从而提高了打破无法学习数据的能力,显示出比线性可分技术更好的性能,进一步指出现有的数据保护方法在防止未经授权的机器学习模型使用数据方面是不充分的,迫切需要开发更强大的保护机制。
Jun, 2024
本文提出了一种新颖的室内声源定位方法,使用麦克风阵列并基于卷积神经网络(CNN)进行,该方法采用原始音频信号作为输入信息直接估计声源的三维位置,避免了手工制作音频特征。通过使用半合成数据作为训练策略并在实际数据上进行微调,该方法能够显著改善基于 ${SRP-PHAT}$ 策略的现有定位方法,并且展现出更好的对抗不同说话者性别和不同窗口大小的性能。
Jul, 2018
本研究提出了一种基于 PU 分类器和 RKD 方案的网络压缩方法,可在云上利用少量标记数据和大量无标签数据来加速深度学习模型训练,对观测数据的处理有较好的鲁棒性。实验证明该方法在 ImageNet 数据集可以在仅使用 8%标记数据的情况下,获得与 ResNet-34 等基线模型性能相当的高效模型。
Sep, 2019
本文提出了一种针对 Diffusion Model 的保护图像的方法,通过生成样本特定的扰动噪声使训练数据难以被 Diffusion Model 学习,以此保护隐私和版权。
Jun, 2023
本文提出了一种错误最小化的噪声类型,可以防止深度学习模型从个人数据中学习,这种噪声对人眼不可见,可以应用于面部识别等实际场景,并在样本和类别形式下取得了实证效果,从而对防止数据滥用奠定了重要基础。
Jan, 2021
本论文提出一种新的深度学习结构 —— 深度音频先验,该方法可在缺乏训练数据的情况下,通过结构和时间信息解决通用盲源分离、交互式音频编辑、音频纹理合成和音频共分离等具有挑战性的音频问题,同时作者通过构建大量数据集且进行严格的实验验证了此方法的有效性。
Dec, 2019