BriefGPT.xyz
大模型
Ask
alpha
关键词
wer
搜索结果 - 5
O-1: 使用预先准备好的标注和最佳假设的自我训练
介绍了 O-1,一种新的自我训练目标,用于减少训练偏差,统一训练和评估指标,用于语音识别。O-1 是期望最小贝叶斯风险(EMBR)的一种更快的变体,提升了最佳假设,并可以适应有监督和无监督数据。通过在公开可用的 SpeechStew 数据集
→
PDF
a year ago
Vistaar: 用于印度语音识别的多元基准和训练集
本文提出了 Vistaar,59 个受试语言和领域组合的基准,用于评估和改进三个公开的 ASR 系统和两个商业系统,同时使用 IndicWhisper 通过在 12 种印度语言上进行微调,在 Vistaar 基准中明显改善了考虑到的 ASR
→
PDF
a year ago
探究自动语音识别系统对 L2 英语语音变异的敏感性
使用一种探测方法,发现了 ASR 系统处理在 L2 英语方言中的发音差异时,出现了声素级别的错误并产生了更高的 WER。这项工作系统地说明了 ASR 的行为,通过确定特定问题的物质来源来提高 ASR 的准确性。
PDF
a year ago
朝向解缠语音表示
本研究构建了一种联合建模的声学表征学习任务,强调去耦合(disentanglement)声音信号的相关和无关部分,然后证明这些理想的、去耦合的方案具有独特的统计性质,并在训练期间强制执行这些性质,使平均 WER 相对提高了 24.5%,这提
→
PDF
2 years ago
COLING
深度标声符号化:用于改进阿拉伯语标声符号化的高效分层循环
本文提出了一种针对阿拉伯文音标的新型网络结构,使用基于词和字符层级的循环神经网络层级结构和交叉层级的注意力机制,进一步提高了网络的可解释性。使用额外技巧如句子 dropout 和多数投票进一步提高了模型性能,使得在 Tashkeela 阿拉
→
PDF
4 years ago
Prev
Next