BriefGPT.xyz
Ask
alpha
关键词
multimedia understanding
搜索结果 - 3
以比特流封面判断视频
视频分类中,通过研究视频的压缩比特流来代替传统方法中涉及视频解压缩的特征提取,以提高分类性能和处理速度。通过验证自定义数据集,结果表明该方法在精度、准确率和召回率方面都超过 80%,而且处理速度是真实时间的 15000 倍,比传统的动态时间
→
PDF
10 months ago
MM
3D 场景中的密集物体定位
通过语义定位 3D 场景中的物体是多媒体理解领域的一项基础且重要的任务,本研究提出了一种名为 3D Dense Object Grounding (3D DOG) 的新任务,通过更复杂的段落描述而不是单个句子来共同定位多个物体,提出了一种基
→
PDF
10 months ago
MM
学习潜在的时空组合模型用于人类动作识别
通过构建表达力强的组合行为模型,模拟视频中动作实例的时空组合,采用弱监督学习算法,识别行为的潜在结构,最终实验结果表明该方法在动作识别方面的表现优于竞争方法。
PDF
9 years ago
Prev
Next