BriefGPT.xyz
Ask
alpha
关键词
lip reading
搜索结果 - 23
深度唇语识别:模型比较和在线应用
本文旨在发展最先进的口型阅读模型,分别使用 LSTM 递归模型、全卷积模型和最近提出的 Transformer 模型,并通过 BBC-Oxford Lip Reading Sentences 2 (LRS2) 基准数据集的实验表明了本研究的
→
PDF
6 years ago
Lip2AudSpec: 从静态唇部运动视频重建语音
通过一个由自动编码器和卷积神经网络构成的模型,在无声视频中对语音信号的频谱表示进行重建,获得了 98% 的相关性并且提高了音频质量。经过多个说话人的联合训练,该模型能够提取出不同说话人的个体特征,具有良好的识别准确率。
PDF
7 years ago
野外口唇阅读句子
本研究目的在于通过观察说话者的口型运动,并结合音频或不结合音频,识别出单词词组和句子。我们提出了一种 “看、听、关注和拼写”(WLAS)网络来学习将口腔运动视频转录为字符的方法,设计了一种课程学习策略来加速训练并减少过拟合,建立了一个视觉语
→
PDF
8 years ago
Prev
Next