关键词audio-visual scene-aware dialog
搜索结果 - 5
- 使用视听 Transformer 进行场景感知对话和推理,并进行联合师生学习PDF3 years ago
- AAAIDSTC8 AVSD 挑战赛的多模态指针网络 TransformerPDF4 years ago
- AAAI文本和视频的桥梁:用于视频音频场景感知对话的通用多模态 TransformerPDF4 years ago
- CVPR音频 - 视觉场景感知对话的简单基线PDF5 years ago
- AAAI从 FiLM 到视频:多模态背景下的多轮问答PDF6 years ago
Prev
Next