BriefGPT.xyz
大模型
Ask
alpha
关键词
video-text models
搜索结果 - 2
ACL
深入了解视频文本模型的运动表示
通过引入生成的 GPT-4 运动描述应用于三个行动数据集并在运动描述检索任务上评估几种视频 - 文本模型,本研究探讨了视频与图片的信息性差异,着重关注视频 - 文本模型对于视频中运动的理解以及需要在现有数据集中加入细致动作信息的问题,并证明
→
PDF
25 days ago
VicTR: 视频条件的文本表示用于活动识别
本文提出了使用 VicTR 方法对视频文本模型进行优化,在视觉信息外,加入文本信息,以提高活动识别性能,实验结果证明在多个基准测试中,该方法具有竞争性能,特别是在视频文本模型的监督、零样本和少样本情况下。
PDF
a year ago
Prev
Next