BriefGPT.xyz
Ask
alpha
关键词
video-based conversation
搜索结果 - 1
Video-ChatGPT: 通过大型视觉和语言模型实现详细视频理解
介绍了基于视觉编码器与大型语言模型相结合的 Video-ChatGPT 模型,用于理解和生成关于视频的人类对话,并介绍了使用手动和半自动管道获得的新数据集,可用于训练和评估基于视频的对话模型,并在定量评估框架下分析了该模型的优劣。
PDF
a year ago
Prev
Next