BriefGPT.xyz
大模型
Ask
alpha
关键词
image interpretation
搜索结果 - 3
IMAD: 图像增强的多模态对话
该研究提出了一种基于多模态视角的对话系统,并通过构建 IMAD 数据集和进行基线模型训练,证明了其在图像解释、数据集建设和模型表现方面具有潜在优势。
PDF
a year ago
多粒度推理用于图像社交关系识别
本研究提出了一种基于多粒度推理的社交关系识别框架,包括全局知识,中层细节和细粒度姿态关键点。研究设计了基于姿态指导的人物对象图和人物姿态图来建模人物到对象的动作和配对人物之间的交互,并借助图卷积网络进行社交关系推理。实验结果表明提出的框架在
→
PDF
5 years ago
使用生成概率图形程序的近似贝叶斯图像解释
这篇论文介绍了一个基于概率编程和计算机图形学的方法来解决计算机视觉中的图形逆问题,提出了一种简洁的概率图形程序来定义灵活的生成模型,并自动反演真实世界图像以诠释它们。
PDF
11 years ago
Prev
Next