Aug, 2013

联合视频和文本解析:理解事件和回答查询

TL;DR本文提出了一种视频和文本联合解析的框架,通过使用基于空间、时间和因果关系的 And-Or 图对视频和文本的信息进行深层语义解析,旨在推动生成叙述性文本描述和问答等应用。其中,视频解析、文本解析和联合推理三个模块组成了该联合解析系统,通过匹配、推断和修改来产生联合解析图,进一步提高了查询准确性。