BriefGPT.xyz
Ask
alpha
关键词
speech datasets
搜索结果 - 5
促进精神健康与神经疾病研究中的公平和多样性言语数据集
我们综述了用于心理健康和神经学障碍的语音数据集,以突出可能存在的陷阱和改进机会,提倡公平和多样性,为建立这个领域的语音数据集提供了一个包含伦理关切的综合清单。
PDF
a month ago
儿童阅读的端到端实时跟踪与指针网络
本研究介绍了一种使用实时阅读跟踪器在儿童语音上进行高效构建的方法,通过采用端到端模型和指针网络的结构,不仅减少了语音跟踪中的延迟问题,还使用强制对齐生成了地面真实文本与读音之间的训练信号,实验结果表明这种方法能够在不同数据集上以高精确度跟踪
→
PDF
9 months ago
分析音频质量对研究婴儿指向性语言的自然长录音使用的影响
研究了婴儿语言习得的计算模型,并探讨了自然语音数据的音频质量对分析和实验的影响,发现采用适度高音质的自然语音数据和采用自动化声音质量评估工具能够获得与人工质量注释相当的结果。
PDF
a year ago
Spaiche:扩展最先进的 ASR 模型以支持瑞士德语方言
本研究旨在提高 ASR 模型在瑞士德语方言上的表现,通过提供对最新发布的瑞士德语语音数据集上现有现有 ASR 模型性能的深入了解。我们提出了一种考虑预测和真实标签之间语义距离的新型损失函数,通过对 Swiss-German 数据集上 Ope
→
PDF
a year ago
一种用于时序数据的循环潜变量模型
本文研究了将潜在随机变量引入到循环神经网络(RNN)的动态隐藏状态中,结合变分自编码器,通过高级潜在随机变量建立了变分循环神经网络(VRNN),可以很好地建模结构化序列数据,如自然语音。通过对四个语音数据集和一个手写数据集的实证评估,证明了
→
PDF
9 years ago
Prev
Next