BriefGPT.xyz
大模型
Ask
alpha
关键词
vqa algorithms
搜索结果 - 2
从自然语言到可验证图像生成的视觉属性转移
本研究提出一种自然语言到有效图像生成(NL2VI)的方法,将自然提示转换为更适合图像生成的可视提示。通过实验,将自然提示与图像生成对齐可以提高生成图像的一致性,尤其在烹饪和 DIY 等领域具有广泛的推广和应用。
PDF
a year ago
通向万能视觉问答模型之路:回答它们的全部问题!
该论文研究了视觉问答算法,发现现有算法在自然图像理解和推理两个领域上不能很好地综合运用。作者提出了一种新的 VQA 算法,能够在这两个领域上达到或超越现有算法的水平。
PDF
5 years ago
Prev
Next