BriefGPT.xyz
Ask
alpha
关键词
captioner
搜索结果 - 2
基于问题分解的知识驱动和视觉推理解耦的知识图谱可视问答
我们研究了基于知识的视觉问答问题,通过将复杂问题替换为多个简单问题,从图像中提取更相关的信息来增强对图像的理解,并在三个著名的视觉问答数据集中实现了高达 2% 的准确率提升。
PDF
9 days ago
IG 字幕生成器:信息增益字幕生成器是强零样本分类器
通过改进生成式训练中的评价目标,研究致力于缩小生成式字幕生成器和 CLIP 分类器之间的差距,实现零样本图像分类和图像 - 文本检索任务上表现可比的效果,并希望进一步研究将生成式与判别式训练程序统一的方法。
PDF
7 months ago
Prev
Next