Dec, 2016

大规模视频数据集中离散状态的半自动标注

TL;DR提出了一个半自动视频帧注释的框架,可以通过隐马尔可夫模型对每个视频帧进行标记,该模型旨在对底层对象和其图像处理算法的状态进行建模,从而将视频的注释从一个逐帧标记的问题降为检测底层对象状态转换的问题,该方法在司机凝视分类数据集上进行了评估,取得了较高的准确率和大幅减少了手动注释工作量。