BriefGPT.xyz
Ask
alpha
关键词
acoustic speech signals
搜索结果 - 2
基于 Wav2vec 的言语智能识别与严重程度分类 —— 以口吃为例
通过使用预训练的 wav2vec 2.0 模型作为特征提取器,本研究对发音困难症的声学语音信号进行了自动检测和严重程度分类,结果表明使用 wav2vec 模型的第一层嵌入特征在准确度上相较于基线特征(声谱图)提升了 1.23%,在严重程度分
→
PDF
9 months ago
语音情感:探究模型表达、多任务学习和知识蒸馏
本研究探讨利用预训练的声学模型,将词汇信息融合到声学语音信号中,以改善情感估计,特别是情感维度中的愉悦度估计,并且发现预训练的模型嵌入融合可比标准声学特征基线(Mel 滤波器的能量)产生更好的效果,且经测试可以推广到其他数据集上。
PDF
2 years ago
Prev
Next