BriefGPT.xyz
大模型
Ask
alpha
关键词
acoustic embeddings
搜索结果 - 3
基于音频文本的关键词检测的关系代理损失
通过引入关系型代理损失(RPL)的概念,利用声学嵌入和文本嵌入之间的关系结构,改进了现有方法,在华尔街日报(WSJ)语料库上展示了更好的性能。
PDF
a month ago
一种基于 CTC 对齐的非自回归变压器模型用于端到端自动语音识别
本论文介绍了一种 CTC Alignment-based Single-Step Non-Autoregressive Transformer(CASS-NAT)方法,用于自动语音识别,通过利用与 CTC 对齐的语音边界信息提取标记级别音频
→
PDF
a year ago
建模语音变化的神经表征
研究使用自我监督的神经模型从语音中提取声学嵌入,计算非英语母语和英语母语以及挪威方言发音之间的基于单词的差异,并发现使用转换器的神经模型提取的语音表示与人类感知匹配得更好。
PDF
4 years ago
Prev
Next