关键词audio-visual dataset
搜索结果 - 10
- AVicuna: 基于交错器和上下文边界对齐的音视频 LLM 用于时间参考对话PDF3 months ago
- 交通视频中异常检测的音视频数据集和方法PDFa year ago
- 一种多用途的音频 - 视觉语料库,用于多模式波斯语语音识别:Arman-AV 数据集PDFa year ago
- AAAIAVCAffe:面向远程办公的大规模认知负荷和情感的音视频数据集PDF2 years ago
- Swin Transformer 面部表情识别PDF2 years ago
- VGGSound:大规模音频视觉数据集PDF4 years ago
- 使用跨模态自监督进行解缠语音嵌入PDF4 years ago
- 音频和视觉信号的跨模态映射的深度潜在空间学习PDF5 years ago
- AVA-ActiveSpeaker: 一份用于活动说话人检测的音频 - 视觉数据集PDF5 years ago
- 跨模态监督学习视频中的活动发言者检测PDF8 years ago
Prev
Next