diverse captions | BriefGPT

关键词diverse captions

搜索结果 - 5

MAGIC: 多模态关系图对抗推理，用于不同和不配对的基于文本的图像标题
研究了如何利用 unpaired training paradigm 生成多样化的文字图像描述，提出了 Multimodal relAtional Graph adversarIal inferenCe (MAGIC) 框架，并使用一种级联
PDF3 years ago
ECCV可控长度的图像描述生成
本文提出了一种基于长度级别嵌入的、具备控制图像描述语言能力的、非自回归图像描述模型，实验证明该模型在 MS COCO 数据集上不仅实现了 SOTA 水平，还能够生成长度可控、多样化的图像描述。
PDF4 years ago
MM通过强化行列式点过程实现多样化准确的图像描述
通过结合 DPP 和强化学习，提出了一种 R-DPP 方法，以生成一个高质量和多样性的图像标注集合，并表明其在准确性和多样性方面的表现优于 GAN、VAE 等基于噪声的控制信号。
PDF5 years ago
CVPR基于词性引导的快速、多样化和准确的图像字幕生成
本文提出了一种新的图像描述生成方法，先预测图像的意思概要，再基于该概要生成文本，相比于传统 beam search 的方法，本文方法在文本多样性、计算效率和生成的描述准确性方面都有明显提高。
PDF6 years ago
ICCV用对抗训练将机器字幕匹配到人类字幕
通过对抗训练结合 Gumbel 抽样，将图像标题生成器的训练目标从复制 groundtruth 标题更改为生成一组无法区分于人类生成的标题，从而生成更多元、不太偏斜的标题，统计上也更匹配人类。
PDF7 years ago