BriefGPT.xyz
大模型
Ask
alpha
关键词
scene knowledge
搜索结果 - 2
以场景为驱动的多模态知识图构建用于具象人工智能
通过结合传统的知识工程和大型语言模型,我们提出了一种以场景驱动的多模态知识图谱构建方法,用于知识表示和增强室内机器人功能。我们通过实例化 ManipMob-MMKG 评估了我们方法的优势,在数据收集效率和知识质量方面具有广泛的优越性。实验结
→
PDF
8 months ago
CVPR
运用场景知识推进视觉连接:基准与方法
本文提出了一个新的基准数据集 SK-VG,其中图像内容和指代表达不足以确定目标对象,迫使模型在长篇场景知识上具备推理能力。我们提出了两种方法来接受三元类型的输入,前者在图像查询交互之前将知识嵌入图像特征,后者利用语言结构来辅助计算图像文本匹
→
PDF
a year ago
Prev
Next