关键词audio-visual
搜索结果 - 29
  • XLAVS-R:跨语言音视频言语表征学习用于噪音鲁棒言语感知
    PDF3 months ago
  • 音视少样本学习的文本特征传播
    PDF10 months ago
  • ICCV音视类增量学习
    PDF10 months ago
  • 多模态平衡感知梯度调控弱监督音视频解析
    PDFa year ago
  • STARSS23: 具有声音事件的时空注释的真实场景空间录音的音频 - 视觉数据集
    PDFa year ago
  • NPVForensics: 捆绑非关键音位和视位以便深度伪造检测
    PDFa year ago
  • 轻量级迭代模型在嘈杂环境下的音像语音分离
    PDFa year ago
  • MuAViC: 一个用于稳健语音识别和文本翻译的多语言音视频语料库
    PDFa year ago
  • 汉英双语中,使用改进的装订器增强音像 HUBERT 的实践
    PDFa year ago
  • AAAI时序自监督的音视频对比学习
    PDFa year ago
  • OLKAVS: 一个开放的大规模韩语音频 - 视觉语音数据集
    PDFa year ago
  • MM具备音视频先验的极限规模讲话脸部视频升频
    PDF2 years ago
  • ECCVAudioScopeV2:音视频注意力架构的开放域屏幕声音分离校准
    PDF2 years ago
  • ECCV音视频零样本学习的时间和跨模态注意力
    PDF2 years ago
  • MM利用变换不变性和等变性进行自监督声音定位
    PDF2 years ago
  • ECCV弱监督音视频解析联合模态标签去噪
    PDF2 years ago
  • ICCV记忆中的多模态联想桥接:从面部视频中回溯语音声音
    PDF2 years ago
  • 简单实现的视觉声音定位
    PDF2 years ago
  • 基于神经网络剪枝的迭代微调设计紧凑型视听唤醒词识别系统研究
    PDF2 years ago
  • 基于语义相似样本更好地学习声音定位
    PDF2 years ago
Prev