BriefGPT.xyz
Ask
alpha
关键词
keyframe-caption pairs
搜索结果 - 1
一种挑战性的多模态视频摘要:从视频中同时提取和生成关键帧 - 标题对
该研究论文提出了一个实用的多模态视频摘要任务设置和一个数据集,用于训练和评估该任务。该任务旨在将给定视频总结为预定义数量的关键帧 - 标题对,并以可列举的格式显示,以快速把握视频内容。通过同时优化关键帧选择性能和标题质量,该任务需要仔细考虑
→
PDF
7 months ago
Prev
Next