BriefGPT.xyz
Ask
alpha
关键词
phone recognition
搜索结果 - 5
利用自监督语音表征进行发音错误检测
本文研究了自我监督学习(SSL)模型在第二语言学习者的发音错误检测任务中的应用,比较了使用母语英语数据训练模型的语音识别(PR)方法和直接使用非母语英语数据训练模型的目标任务方法,通过对 L2Arctic 和 EpaDB 两个非母语语音数据
→
PDF
a year ago
ACL
基于 CTC 的直接语音翻译压缩
本研究提出了一种基于 CTC 的动态音频信号压缩方法来改善语音翻译质量,显著提高了 BLEU 评估指标并减少了内存占用。
PDF
3 years ago
基于深度学习的音视频言语修复
本文介绍了一种基于深度学习的框架,用于音频 - 视觉的语音修复,展示了多任务学习与视觉信息对语音信号修复的有效贡献并比较了仅音频信息下的表现。
PDF
4 years ago
从原始语音中学习滤波器组以进行语音识别
通过对原始波形进行滤波及卷积神经网络训练,使得时域滤波器组近似于 Mel 滤波器组,并在 TIMIT 上的电话号码识别实验中,相较于使用 Mel 滤波器的模型,TD-filterbanks 在多个架构上均表现优异,这些滤波器在收敛时具有非对
→
PDF
7 years ago
一种基于原始 - 对偶方法的约束回声状态属性的递归神经网络训练方法
本文提出了一个循环神经网络架构,利用一个全连接的深度神经网络作为其特征提取器,并采用原始 - 对偶训练方法进行学习,实现了 18.86% 的电话识别错误率并优于已有的方法。
PDF
11 years ago
Prev
Next