BriefGPT.xyz
Ask
alpha
关键词
diverse captions
搜索结果 - 5
MAGIC: 多模态关系图对抗推理,用于不同和不配对的基于文本的图像标题
研究了如何利用 unpaired training paradigm 生成多样化的文字图像描述,提出了 Multimodal relAtional Graph adversarIal inferenCe (MAGIC) 框架,并使用一种级联
→
PDF
3 years ago
ECCV
可控长度的图像描述生成
本文提出了一种基于长度级别嵌入的、具备控制图像描述语言能力的、非自回归图像描述模型,实验证明该模型在 MS COCO 数据集上不仅实现了 SOTA 水平,还能够生成长度可控、多样化的图像描述。
PDF
4 years ago
MM
通过强化行列式点过程实现多样化准确的图像描述
通过结合 DPP 和强化学习,提出了一种 R-DPP 方法,以生成一个高质量和多样性的图像标注集合,并表明其在准确性和多样性方面的表现优于 GAN、VAE 等基于噪声的控制信号。
PDF
5 years ago
CVPR
基于词性引导的快速、多样化和准确的图像字幕生成
本文提出了一种新的图像描述生成方法,先预测图像的意思概要,再基于该概要生成文本,相比于传统 beam search 的方法,本文方法在文本多样性、计算效率和生成的描述准确性方面都有明显提高。
PDF
6 years ago
ICCV
用对抗训练将机器字幕匹配到人类字幕
通过对抗训练结合 Gumbel 抽样,将图像标题生成器的训练目标从复制 groundtruth 标题更改为生成一组无法区分于人类生成的标题,从而生成更多元、不太偏斜的标题,统计上也更匹配人类。
PDF
7 years ago
Prev
Next