图像模式的表示学习
META4 是一种深度学习方法,通过从输入文本中计算图像架构来捕获其潜在的语义和隐喻意义,并生成由语音和计算图像架构驱动的隐喻手势,从而解决了先前行为生成模型在生成隐喻手势时未考虑到重要的语义信息的局限性。
Nov, 2023
本文提出了一种基于 schema 推理的新型推理范式,该范式通过构建先前的深度神经网络(DNN)转发方案重建来学习演绎地推断出可解释的预测,同时建立了一种模型推断管道,利用人类推理机制的印象匹配类比,将图像中提取的视觉概念与先前计算得到的场景印象联系起来,建立了顶部关系图来模拟输入实例的视觉语义和目标类别的抽象想象。同时,引入了一种通用的 Feat2Graph 方案,可以在全局视角下捕捉和利用视觉语义的组成贡献,以建立包含丰富交互信息的关系图。该提出的 schema 推理方法在多个基准测试中达到了令人鼓舞的性能,并揭示了导致预测的演绎过程的清晰图片。
Mar, 2023
本研究提出基于模式的抽象模型,该模型的经验可用于迅速的迁移学习、推理和规划,利用潜在的图结构将已有的经验转化为知识,通过学习、匹配和重用图模式实现快速的任务解决,并在导航等更具挑战性的环境中进行演示。
Feb, 2023
本文提出了使用自然语言处理(NLP)中广泛使用的抽象意义表述(AMR)来建立更具有语言信息的图片抽象表述(称为视觉 AMR 图),并通过重复试验和分析表明,我们可以重用现有的文本到 AMR 分析器来分析图像到 AMRs 的转换。
Oct, 2022
本文提出了一种名为 IKRL 的图像化知识表示学习模型,利用实体图片提供的视觉丰富的信息作为辅助,经过三元组和图片的双重信息进行知识表示的学习,在知识图谱完成和三元组分类上表现出了优越性。
Sep, 2016
该研究探讨了一种计算模型,即词嵌入模型,通过将词表示为多维空间中的向量,从词汇共现模式中学习来自语义记忆中的常见知识,并提出了语义投影的解决方案,以检验词嵌入模型是否能够恢复多种语义特征和对象属性的上下文依赖关系。
Feb, 2018
本文提出利用暗示的视觉引导表达学习表示,自动地从图像和文本的数据集中挖掘出的结构关系,用于多模态学习模型中的视觉语言融合任务,证明了该方法在跨模态图片检索、指代表达和组合属性对象识别中的有效性。
Oct, 2020