BriefGPT.xyz
大模型
Ask
alpha
关键词
audio word2vec
搜索结果 - 3
基于语音和文本数据的音位结构学习,较少资源近乎无监督的语音识别
利用音频字向量和自编码器实现跨模态的语音识别,演示了即使缺乏训练数据,也可以从少量音频和文本之间的嵌入对齐中进行 ASR 系统的训练。
PDF
6 years ago
口语词汇的音义嵌入及其在口语内容检索中的应用
本文介绍了一种两阶段框架,用于考虑口语单词的上下文执行音素语义嵌入,第一阶段执行音素嵌入,第二阶段执行语义嵌入,我们进一步提出了通过文本嵌入并行评估在第二阶段获得的音频嵌入的音素和语义性质。
PDF
6 years ago
基於序列到序列自編碼器的聲音片段無監督表示學習
本文提出了一种并行版本的 Audio Word2Vec,旨在为变长音频片段提供固定维度的向量表示,用于无人工注释的语音数据的无监督学习,并且采用 Denoising Sequence-to-sequence Autoencoder 进行更稳
→
PDF
8 years ago
Prev
Next