关键词lip-reading
搜索结果 - 14
  • MTGA: 多视角时间粒度对齐聚合在基于事件的唇读中的应用
    PDF3 months ago
  • ACLOpenSR: 通过维护多模态对齐实现开放式语音识别
    PDFa year ago
  • 基于字级别的波斯语唇语数据集
    PDFa year ago
  • 唇读口型理解:利用跨模态知识蒸馏混合感官进行基于单词模型的唇形理解
    PDF2 years ago
  • ICLR基于掩码多模态聚类预测的音视频语音表征学习
    PDF2 years ago
  • LiRA: 通过自监督学习从音频中学习视觉语音表示
    PDF3 years ago
  • 使用紧密连接的时间卷积网络进行唇语识别
    PDF4 years ago
  • 基于声码器的无声视频语音合成
    PDF4 years ago
  • 伪卷积策略梯度用于序列到序列的口语读唇
    PDF4 years ago
  • 使用时间卷积网络进行唇读
    PDF4 years ago
  • 多粒度时空建模用于唇读
    PDF5 years ago
  • 基于时间 GAN 的端到端语音驱动的面部动画
    PDF6 years ago
  • 视觉语音识别的分辨率限制
    PDF7 years ago
  • 哪些音素到视音素映射能最好地提高仅靠视觉进行的计算机唇读准确率?
    PDF7 years ago
Prev
Next