关键词audio-visual dataset
搜索结果 - 10
  • AVicuna: 基于交错器和上下文边界对齐的音视频 LLM 用于时间参考对话
    PDF3 months ago
  • 交通视频中异常检测的音视频数据集和方法
    PDFa year ago
  • 一种多用途的音频 - 视觉语料库,用于多模式波斯语语音识别:Arman-AV 数据集
    PDFa year ago
  • AAAIAVCAffe:面向远程办公的大规模认知负荷和情感的音视频数据集
    PDF2 years ago
  • Swin Transformer 面部表情识别
    PDF2 years ago
  • VGGSound:大规模音频视觉数据集
    PDF4 years ago
  • 使用跨模态自监督进行解缠语音嵌入
    PDF4 years ago
  • 音频和视觉信号的跨模态映射的深度潜在空间学习
    PDF5 years ago
  • AVA-ActiveSpeaker: 一份用于活动说话人检测的音频 - 视觉数据集
    PDF5 years ago
  • 跨模态监督学习视频中的活动发言者检测
    PDF8 years ago
Prev
Next