BriefGPT.xyz
大模型
Ask
alpha
关键词
sequence-to-sequence loss
搜索结果 - 1
深度音视频语音识别
本论文旨在识别带有或不带有音频的说话者嘴唇所述的短语和句子,我们提出了使用自注意力机制的 CTC 和序列到序列两种模型进行唇语识别,并研究唇语识别在有噪音的情况下与音频识别的互补性,同时我们介绍并公开发布了英国电视上成千上万自然语言的新数据
→
PDF
6 years ago
Prev
Next