BriefGPT.xyz
Ask
alpha
关键词
multimodal learning framework
搜索结果 - 1
ECCV
地理标记音视航拍场景识别的跨任务传递
利用声音信息结合图像信息进行空中场景识别,通过构建新的 AVANET 数据集,通过多模式的学习框架将声音事件的知识转化到空中场景识别的任务中,提高识别效果。
PDF
4 years ago
Prev
Next