利用线性预测方法优化基于深度学习的共振峰追踪器
本研究提出了一种新颖的说话者去识别方法,采用简单的共振峰偏移和基于函数数据分析的 f0 轨迹操作,可以在音素可控的方式下掩盖潜在的识别音调特征,提高了基于共振峰的语音匿名度最多达 25%。
Mar, 2022
提出了一种新的算法来将有声语音的检测、基频估计和音高跟踪三个子任务集成成一个单一的过程,并通过使用标准度量标准的组合提出了一个无监督语音分类器来实现音素检测。音高值的估计采用混合自相关技术,通过引入前向 - 后向 Kalman 滤波器来平滑音高轮廓。本研究在实验中表明,所提出的方法与当前最先进的音高检测算法相比具有明显的优势。
Mar, 2021
我们提出了一种新的 Moment Probing (MP) 方法,通过特征分布上的线性分类器,利用特征中更丰富的统计信息来进一步探索 LP 的潜力,并通过多头卷积交叉协方差(MHC^3)以高效有效的方式计算二阶矩。通过在十个基准测试上进行广泛实验,我们的 MP 在少量训练成本下显著优于 LP,并且我们的 MP + 达到了最先进的性能。
Jul, 2023
通过理论研究和实证评估,本文分析了差分隐私 fine-tuning 方法的训练动态,并探讨了顺序 fine-tuning 的现象及其对测试损失的影响,为过参数化神经网络中的差分隐私调优提供了理论洞见和隐私预算分配规则。
Feb, 2024
本文介绍了一种结合数据和模型的方法来完成面部关键点的检测,即先利用全卷积网络(Fully Convolutional Network, FCN)来生成脸部所有关键点的响应图,再利用 Point Distribution Model(PDM)生成初始面部形状,最后使用加权变体的正则化关键点均值漂移(RLMS)来微调面部形状,实验表明本文提出的方法在面部表情、头部姿态和部分遮挡等挑战性数据集上都能够取得最好的表现。
Nov, 2016
本文介绍了一种名为 LQF 的线性优化模型,使用 Leaky-ReLU 激活函数、平均平方误差损失函数和 Kronecker 矩阵分解的预处理方式,使得该模型在大多数实际图像分类任务中具有与非线性优化方法相当的性能,且具有线性模型的可解释性和鲁棒性。
Dec, 2020
本文章探讨了数字处理语音信号和语音识别算法的重要性,介绍了特征提取和匹配的数字信号处理方法以及非参数模型和动态时间规整技术的优越性。
Mar, 2010