BriefGPT.xyz
Ask
alpha
关键词
video-based question answering
搜索结果 - 2
听力先行:具有讲话者关注的视频对齐
利用跨模态对齐和表示融合方法,在 Social IQ 2.0 数据集上取得了 82.06%的准确率,增强了视频模态的利用能力,并通过降低语言过拟合和当前技术所遇到的视频模态绕过等问题,提高了性能。
PDF
3 months ago
AAAI
利用视频描述学习视频问答
本文提出了一种可扩展的视频问答技术,利用自动生成的大量候选问题 - 答案对并使用自适应学习方法以处理其中存在的非理想数据,取得了优于基线模型的效果。
PDF
8 years ago
Prev
Next