caption diversity | BriefGPT

关键词caption diversity

搜索结果 - 4

CVPR标题：字幕中的内容？数据集特定的语言多样性及其对视觉描述模型和度量的影响
研究自动视频描述领域的发展，发现数据集所具有的语言多样性是影响生成泛化性通用和无信息的描述文本的关键因素。推荐多样性采集新数据的方法和应对当前模型和指标多样性有限的后果的方法和方法。
PDF2 years ago
ECCV通过场景图分解实现全面图像字幕化
通过细粒度的图像场景图表示，我们重新设计了图像标题生成模型，实现了准确、多样、可控制的标题生成，同时在标题多样性、项点化及可控制性等方面均取得了最新最佳结果。
PDF4 years ago
CVPR任意定制：使用抽象场景图精细控制图像字幕生成
提出了一种基于 Abstract Scene Graph 结构的 ASG2Caption 模型，通过识别图形中的用户意图和语义，生成用户想要的注释，进而实现更好的可控性和注释多样性。
PDF4 years ago
CVPRShow, Control and Tell: 一种生成可控和有基础的字幕的框架
本文介绍了一种新的图像字幕生成框架，该框架包括具有预测文本块和约束条件的递归架构，这些约束条件是通过控制信号（图像区域的序列或集合）确定的，并通过允许地面化和可控性来产生多样化的描述。实验表明，该方法在可控的图像字幕生成方面取得了最先进的性
PDF6 years ago