BriefGPT.xyz
大模型
Ask
alpha
关键词
video qa
搜索结果 - 6
COLING
野外视频问答
提出了 WILDQA 数据集,包含视频问答(Video QA)和视频证据选择(Video Evidence Selection)两项任务,以在户外环境下录制的视频为主,对该数据集进行了广泛的基线测试和评估。
PDF
2 years ago
用于视频问答的结构化双流注意力网络
本文提出了一种结构化的双流注意力网络(STA)来解决视频问答(VQA),该网络可以识别视频中的长时空结构和文本特征,并将视觉与文本融合以提供准确的答案,在大规模视频 QA 数据集 TGIF-QA 上实验表明,STA 可将 Action,Tr
→
PDF
2 years ago
IJCAI
视频问答的分层面向对象时空推理
通过提出一种基于对象导向推理的动态交互视频场景中的视觉物体关系、行为和事件的深度神经网络模型(HOSTR),能够在多个视频问题回答基准数据集中取得最新的最高成就并显示出其可靠性、可解释性和高效性。
PDF
3 years ago
CVPR
层次化条件关系网络用于多模态视频问答
该论文主要介绍了一种基于条件计算结构的一般性可重用神经元 CRN 和视频 QA 中的分层条件关系网络 HCRN,旨在解决视频问题答案推理的问题。并在广泛的真实世界数据集上展示了其优越性能。
PDF
4 years ago
AAAI
DramaQA:基于角色的视频故事理解与分层问答
本研究提供了一种综合理解视频故事的新的视频问答(Video QA)任务,名为 DramaQA,使用层次化的问题回答和基于人类认知过程的评估标准,以及基于角色的视频注释来建模故事的局部连贯性。研究者们还提供了一个多层级上下文匹配模型来回答问题
→
PDF
4 years ago
视频问答的快慢神经推理
本研究提出了一种基于双过程神经架构的视频问答系统,该系统能够理解语言、表示视频内容,并通过多步推理过程得出答案
PDF
5 years ago
Prev
Next