BriefGPT.xyz
大模型
Ask
alpha
关键词
phonetic content
搜索结果 - 3
有监督的声学嵌入及其在不同语言之间的可转移性
本文研究了使用自监督预训练技术来提高语音识别的准确性,发现在监督学习框架中,利用不同的预训练自监督特征作为 Acoustic Word Embeddings 的输入是最有效的方法,并且这种方法可实现跨语言迁移。
PDF
2 years ago
零语音 2020 挑战中基于向量量化的神经网络用于语音单元发现
本文提出两种神经模型,均使用向量量化技术将连续特征映射为有限的编码,旨在利用无标签数据学习将语音的音素内容与说话人特定细节分离的离散表述。在 Zero Speech 2020 挑战赛的英语和印度尼西亚语数据上,我们的两个模型都优于 2019
→
PDF
4 years ago
ACL
多目标自回归预测编码改进语音表示
通过未标记的语音学习有意义的表示方法,将预测编码的培训目标应用于自回归预测编码(ARPC),并提出了一种辅助目标以提高未来帧预测任务的泛化能力和语音内容。不仅支持假设,还证明了该方法在学习含有更丰富语音内容的表示方面的有效性。
PDF
4 years ago
Prev
Next