Jun, 2017

用于学习和评估视觉常识技能的 “某某” 视频数据库

TL;DR本研究收集了超过 100,000 个视频,建立了 something-something 数据库,并描述了 crowd-sourcing 数据所面临的挑战。该数据库包含了一些需要理解物理世界、具有常识性的视频预测任务。