BriefGPT.xyz
Ask
alpha
关键词
video encoder
搜索结果 - 3
VideoGPT+: 图像和视频编码器的综合应用以提升视频理解能力
VideoGPT+ combines the benefits of image and video encoders to improve video understanding, achieving enhanced performan
→
PDF
23 days ago
VideoPrism:一种用于视频理解的基础视觉编码器
介绍了一种名为 VideoPrism 的通用视频编码器,利用单个冻结模型解决各种视频理解任务。通过在异构语料库上预训练 VideoPrism,其中包含 3600 万个高质量的视频字幕对和 5.82 亿个带有噪声的平行文本视频剪辑,通过全局
→
PDF
5 months ago
低保真端到端视频编码器预训练用于时间动作定位
提出了一种新的 LoFi 视频编码器预训练方法,通过减少时空或时空分辨率的 mini-batch 组合来实现对编码器的端到端优化,有助于解决任务不一致性问题并提供更有效的特征表示,从而显著提高了现有 TAL 方法的性能。
PDF
3 years ago
Prev
Next