BriefGPT.xyz
Ask
alpha
关键词
synthetic image-text pairs
搜索结果 - 3
Synth$^2$: 用合成标题和图像嵌入提升视觉 - 语言模型
我们提出了一种利用大语言模型(LLM)和图像生成模型的优点来创建合成图像 - 文本对的新方法,以用于视觉语言模型(VLM)的高效训练。通过预训练一个文本到图像模型来合成由 LLM 生成的图像嵌入,我们的方法能够用合成数据训练出仅需使用人工标
→
PDF
4 months ago
AAAI
通过合成对的方法改善文本式图像描述的跨模态对齐
本研究提出了一种新方法,通过结合合成的图像文本对来解决图像标注中存在的跨模态对齐问题。通过使用预训练的文本到图像模型生成图像,并优化合成图像在 CLIP 嵌入空间中的伪特征以接近真实图像特征,同时利用图像中的显著对象来增强模态对齐的学习。实
→
PDF
7 months ago
多层上下文数据生成的纯文本图像标注
本文提出了一种新的多情景数据生成框架用于提高文本图像注释的训练数据,该框架使用扩散模型生成复杂和简单图像,并在 MSCOCO、Flickr30k 和 SS1M 等数据集上实现了最先进的表现。
PDF
a year ago
Prev
Next