KDDFeb, 2024

视频注释工具:使用视觉语言模型和主动学习有效构建视频分类器的框架

TL;DR通过人机交互系统的更直接参与,使用一种新的框架 Video Annotator(VA)对视频分类数据集进行注释、管理和迭代,提高模型开发过程的效率、可用性和有效性,实现高质量模型的高效创建。