BriefGPT.xyz
Ask
alpha
关键词
alignment models
搜索结果 - 1
VideoCon: 强大的视频 - 语言对齐通过对比字幕
通过介绍 VideoCon,我们的研究在应对视频字幕中语义上合理的对比变化方面改进了视频 - 语言对齐模型的鲁棒性,提出了一个广泛的对比失配频谱,并通过一个大规模语言模型构建了基于对比视频字幕的 VideoCon 对齐数据集,我们的对齐模型
→
PDF
8 months ago
Prev
Next