BriefGPT.xyz
Ask
alpha
关键词
dense captions
搜索结果 - 3
ShareGPT4Video: 提升视频理解与生成,优化字幕
通过稠密和精确的字幕,在大视频 - 语言模型(LVLMs)的视频理解和文本 - 视频模型(T2VMs)的视频生成方面,我们提出了 ShareGPT4Video 系列,该系列包括 40K GPT4V 标注的各种长度和来源的视频稠密字幕,通过精
→
PDF
a month ago
ICCV
注意力调制下的密集文本到图像生成
通过 DenseDiffusion 方法,我们能够在不需额外微调或数据集的情况下,有效改善给定密集描述的图像生成性能,并且达到与专门训练有场景布局条件的模型相似的视觉效果。
PDF
10 months ago
IIITD-20K: 文本 - 图像 ReID 的密集字幕
提出了一个新的名为 IIITD-20K 的数据集,包括 20000 个在野外抓取的唯一身份的密集标题,使用生成图像和精细的标题进一步多样化身份,并进行了实验以将其与目前最先进的文本到图像 ReID 模型进行对比。
PDF
a year ago
Prev
Next