BriefGPT.xyz
Ask
alpha
关键词
news image captioning
搜索结果 - 3
针对新闻图像字幕生成的实体感知多模态对齐框架
新闻图像标题任务是图像标题任务的一种变体,要求模型生成与新闻图像和相关新闻文章更相关的标题。多模态大型语言模型在近年来得到快速发展,并在新闻图像标题任务中具有良好的前景。然而,根据我们的实验,普通的多模态大型语言模型在零样本学习环境中生成实
→
PDF
4 months ago
新闻图片标题生成的视觉感知上下文建模
新闻图像字幕生成的自动化方法通过设计面部命名模块和检索策略以优化视觉信息处理,并超越之前的最佳性能表现。
PDF
a year ago
EMNLP
为新闻图像字幕选择相关和充分的上下文
本文提出了利用已预训练的视觉和语言检索模型 CLIP 来定位新闻文章中的可视化实体,并通过开放式关系抽取模型捕获非视觉实体,从而显着提高现有模型的性能和实现新的多个基准的最新性能。
PDF
2 years ago
Prev
Next