关键词audio
搜索结果 - 68
  • ICLRLEAF: 可学习的音频分类前端
    PDF3 years ago
  • TaL:一份同步的多说话人的舌头超声成像、音频和嘴唇视频语料库
    PDF4 years ago
  • 利用自监督预训练的声学和语言特征进行连续语音情感识别
    PDF4 years ago
  • 从文本、音频、说话者身份的三模态上下文生成言语手势
    PDF4 years ago
  • 自监督多模态通用网络
    PDF4 years ago
  • MakeItTalk: 面向发言人的说话人头动画
    PDF4 years ago
  • ViSQOL v3: 一种开源的、生产就绪的客观语音和音频指标
    PDF4 years ago
  • ESResNet:基于视觉领域模型的环境声音分类
    PDF4 years ago
  • AlignNet: 音频视觉对齐的统一方法
    PDF4 years ago
  • LibriVoxDeEn: 一个用于德语到英语语音翻译和德语语音识别的语料库
    PDF5 years ago
  • ICCVEPIC-Fusion: 基于视听时空绑定的第一人称动作识别
    PDF5 years ago
  • 使用基于注意力的双向 LSTM 网络从单个音频生成语音 / 面部动画
    PDF5 years ago
  • AAAI情感分析中的多特征和多模态补充融合
    PDF5 years ago
  • 学习音乐和图像之间的情感对应关系
    PDF5 years ago
  • 视听场景感知对话
    PDF5 years ago
  • 自监督同步下的音频和视频模型协同学习
    PDF6 years ago
  • 使用视觉、音频和文本特征进行多模态话语级情感分析
    PDF6 years ago
  • 基于 Tacotron 的端到端韵律转移实现情感化语音合成
    PDF6 years ago
  • 多模态欺骗检测的深度学习方法
    PDF6 years ago
  • ObamaNet: 文本到照片级逼真唇语同步
    PDF7 years ago