ICLRApr, 2021

人类极简视频对动态识别模型的启示

TL;DR研究了人类视觉中空间和时间信息的整合机制,提出了最小视频概念,并发现当前动态视觉识别网络无法重现人类对于整合空间和时间非常有效的能力。