IJCAIJun, 2019

基于分层卷积自注意力网络的开放式长视频问答

TL;DR本论文提出了一种高效的分层卷积自注意编 - 解码神经网络,旨在解决长形视频问答中长程依赖建模和计算成本高的问题。该方法通过分层结构和多通道视频表示的注意力机制,在视频序列中捕捉基于问题的长程依赖关系,提高了回答的效率和准确性。