BriefGPT.xyz
Ask
alpha
关键词
video and textual segmentation
搜索结果 - 1
MHMS: 多模态分层多媒体摘要
本文提出一个交互视觉和语言领域的多模式多媒体总结(MHMS)框架,旨在通过多模式输出为新闻文章自动生成封面图片和标题,或为在线视频提供介绍。本文的 MHMS 方法包含视频和文本细分和摘要模块,分别生成代表性关键帧和文本摘要,并利用最优输运距
→
PDF
2 years ago
Prev
Next