Aug, 2023

面向时空视觉注意建模与理解的分层表示

TL;DR该篇博士论文研究和开发了用于视频序列中的时空视觉注意建模和理解的分层表示。具体而言,我们提出了两个用于视觉注意的计算模型。首先,我们提出了一个上下文感知的生成概率模型,用于视觉注意建模和理解。其次,我们开发了一个深度网络架构,用于视觉注意建模,首先估计自上而下的时空视觉注意,最终用于建模时间域中的注意。