BriefGPT.xyz
Ask
alpha
关键词
ad datasets
搜索结果 - 1
CVPR
AutoAD III:前传 -- 回到像素
生成电影的音频描述(AD)是一项具有挑战性的任务,需要对细粒度的视觉理解和角色及其名称有意识。本文提出了两种构建与视频数据对齐的 AD 数据集的方法,并使用这些数据集构建了训练和评估数据集。我们还开发了基于 Q-former 的架构,它使用
→
PDF
3 months ago
Prev
Next