BriefGPT.xyz
Ask
alpha
关键词
multimodal knowledge graph
搜索结果 - 4
KEBench: 大型视觉语言模型的知识编辑基准
基于多模态知识图,本研究构建了一个新的基准评估 $ extbf {KEBench}$,并扩展了一种新的评估指标(可移植性),通过对五个大型视觉语言模型进行不同编辑方法的实验,深入分析这些方法对模型的影响,揭示了这些方法的优点和不足,为未来的
→
PDF
4 months ago
重现语境:基于多模态知识图谱的相机陷阱物种识别作为链接预测
基于相机陷阱图像的物种识别中,通过在多模态知识图谱中进行链接预测,将异构上下文有效整合到视觉领域,以提高模型的样本效率和泛化性能。
PDF
6 months ago
以场景为驱动的多模态知识图构建用于具象人工智能
通过结合传统的知识工程和大型语言模型,我们提出了一种以场景驱动的多模态知识图谱构建方法,用于知识表示和增强室内机器人功能。我们通过实例化 ManipMob-MMKG 评估了我们方法的优势,在数据收集效率和知识质量方面具有广泛的优越性。实验结
→
PDF
8 months ago
基于序列建模的可解释多模态知识图谱答案预测
本文提出了 IMKGA-SM 模型来解决多模态情况下,知识图谱链接预测的解释性和高准确性问题,使用多模态细粒度融合方法处理图像和文本信息,并将链接预测任务建模为离线强化学习马尔科夫决策模型,并通过交互式感知奖励预期机制和因果屏蔽机制将查询
→
PDF
2 years ago
Prev
Next