BriefGPT.xyz
Ask
alpha
关键词
machine lipreading
搜索结果 - 2
LCANet: 级联注意力 - CTC 的端到端唇语识别
本文提出了一种基于端到端深度神经网络的 LCANet 口型识别系统,利用 3D CNN、highway network 和双向 GRU network 来捕捉短期和长期的空时信息,并采用连续的注意力 - CTC 解码器来生成输出文字,实验结
→
PDF
6 years ago
CVPR
解码视口型:改进机器唇读技术
该研究提出了一种新的说话者依赖性的音素 - 面部表情地图方法,以及从面部表情解码到音素和单词的新方法,展示了在训练音素分类器的最佳范围面部表情中的层次化训练可以显著提高分类准确性。
PDF
7 years ago
Prev
Next