Jul, 2015

多场景视频查询和概述的共享语义空间发现

TL;DR公共空间 CCTV 安装的增长率导致了对自动化利用视频监控数据的方法的需求,包括场景理解、查询、行为注释和摘要。本文提出了一种分布式多场景全局理解的新框架,将监视场景按其解释彼此行为的能力进行聚类,并进一步发现每个聚类中共享与场景特定的活动的子集。在此基础上,我们展示了如何利用多场景结构化表示来改进常见的监控任务,包括场景活动理解、跨场景按示例查询、行为分类和视频摘要。