image caption | BriefGPT - AI 论文速递

关键词image caption

搜索结果 - 5

KiUT: 应用知识的 U-Transformer 用于放射学报告生成
本文提出了一种多模态知识注入的 U-Transformer 模型，用于辅助医学影像报告的自动生成。实验结果表明，该模型在两个广泛使用的基准数据集 IU-Xray 和 MIMIC-CXR 上优于现有技术，并且注入先验知识可以提高模型性能。
PDFa year ago
ICCV通过标题的关注蒸馏生成场景图
文章阐述了如何使用图像注释中的注意力分配机制来增强场景图的估计能力，提出了一种称为主题场景图的方法，学习从图像到自然语言的映射，并用于关系重要性估计。
PDF3 years ago
探索遥感图像描述生成的模型和数据
本研究旨在探讨如何准确、灵活地描述遥感图像。通过提出一些标注指导和构建大规模航空图像数据集，研究证明采用生成语言描述的方式可以全面地描述遥感图像内容。
PDF7 years ago
野外场景下的丰富图像描述
本研究提出了一种图像描述系统，通过在先进的架构上建立深度视觉模型、实体识别模型和信心模型等方式，有效地解决了在野外环境下图像描述的质量、异领域数据处理和低延迟等挑战，并在领域内和领域外的数据集上都显著优于之前的最佳实践结果。
PDF8 years ago
基于区域注意力和场景分解的图像字幕定位与描述对齐
本文提出了一种使用平行结构、利用图像和句子之间的相似性及上下文信息生成图像描述的方法，将视觉感知与文本描述相结合，使用场景特定的上下文信息对句子中的词语生成进行调整，在多个流行数据集上的实验表明本方法在生成精准、丰富的图像描述方面表现优异。
PDF9 years ago