- 使用动作特征学习与人类协同工作
探究网络结构对学习算法利用语义关系的倾向性,发现基于注意力机制构建的网络结构在零样本协调任务中具有更好的归纳偏好,并经过精细的评估和场景分析,证明了这种策略是可解释的, 并且这样的智能体在没有训练任何人类数据的情况下就能够与人类协调一致。
- 使用 Tree-RNN 和 Typed dependencies 识别句子对中的语义关系
提出了一种改进的 DT-RNN 模型,使用句法分析中识别出的语法关系类型来识别非近义句子,实验结果表明,在 SICK 数据集上进行的语义相关性和文本蕴含识别任务上,该模型比 DT-RNN 模型的分类准确率提高了 2%,且模型预测的相似度得分 - ICCV利用场景图进行人 - 物互动检测
提出了一种利用场景图信息进行人 - 物交互(SG2HOI)检测的新方法,该方法通过全局背景信息和关系感知信息传递模块,利用图像中高级和语义的人物和物体关系,通过两种方式将场景图信息融入到 “人 - 物交互” 检测任务中,表现优于两个基准 H - ICLR对比学习的增量式虚假负例检测
本研究提出了一个新的自监督对比学习框架,该框架在训练过程中动态检测错误负样本并加以删除,在多个基准测试中表现优于其他自监督对比学习方法。
- CVPRiMet Collection 2020 标签空间的清洗和结构化
本文旨在发掘 iMet 2020 数据集的潜在价值,提出了一种清洁和结构化 iMet 2020 标签的方法,并介绍了实验结果验证其优势。
- CVPR基于 Transformer 的端到端人 - 物交互检测
本文提出了一种基于 transformer 的编码器解码器框架,直接从图像中预测一组 <人,对象,交互> 三元组,通过此预测方法,我们的算法在不需要耗时的后处理的前提下,有效地利用图像中的固有语义关系,并实现了在对象检测后不到 1ms 的推 - ICCV视觉表示学习中的概念泛化
该论文提出了一个基于自然语言处理技术的 ImageNet-CoG 基准,以系统性地评估模型训练出来的视觉表示对预测过程中视觉概念的泛化能力。通过利用 WordNet 中的专业知识,我们定义了一系列与 ImageNet-1K 子集在语义上越来 - IJCAI逻辑受限指针网络:用于可解释的文本相似度
研究一种使用 BERT 表示组成部分的句子的模型,结合指针网络和 ConceptNet 等知识,实现对文本语义相似性的可解释性分析。实验结果表明,该模型在 chunk alignment 任务上取得了显著的性能提升。
- 通过学习和转移单模相似度实现对抗性跨模检索
本文提出了一种名为交叉模态相似性转移的方法,以无监督的方式学习和保持不成对但语义上相似的数据项目之间的联系,并在类别和对排序检索任务中表现出了优于现有技术的结果。
- ECCV重新审视跨模态检索
本文提出了一种交叉模态检索系统,利用图像和文本编码,实现了同时检索模态的功能,避免了需要为每个模态使用不同网络的缺点。在所使用的知识中,本文是第一篇采用单一网络和融合的图像 - 文本嵌入进行跨模态检索的工作。在 MS-COCO 和 Flic - CVPR学习视觉问答的答案嵌入
该研究提出了一种新的概率模型,用于视觉问答中的多项选择,将嵌入视觉、问答和回答,并考虑到回答之间的语义关系,从而提高了对新问题的表现。
- 基于堆叠语义引导的注意力模型用于细粒度零样本学习
通过使用类别语义特征逐步指导视觉特征生成注意力图来加权不同局部区域的重要性,提出了一种新的堆叠语义引导注意力(S2GA)模型,将集成的视觉特征和类别语义特征馈入多类别分类架构中进行端到端训练,实验结果表明该方法在细粒度零样本分类和检索任务中 - 集体实体消歧的对配对链接:两个可能比全部更好
我们提出了一种新的树形目标函数 MINTREE,并引入了一种新的算法 Pair-Linking 来解决实体消歧的问题,实验证明,与现有的算法相比,我们的方法不仅更准确,而且速度惊人地快。
- NIPS贝叶斯段落向量
本文提出了一种基于神经网络的段落向量的新解释,基于概率论的方法可以通过后验不确定性来在监督学习任务中提升性能,进一步提高了段落向量的研究应用。
- ICML使用约束嵌入空间映射条件生成多模态数据
提出一种条件生成模型,将多种数据的低维嵌入映射到公共潜在空间,并提取它们之间的语义关系,可从普通 MNIST 数字中提取颜色和语音输入,并进行独立条件推断。
- 评估向量空间类比模型
本文评估了将平行四边形模型应用于现代单词嵌入的类比关系能够捕捉基于人类关系相似度判断的能力,并发现其在某些语义关系上表现更好,但同时提供了基于向量空间内在几何约束的更深层次局限性证据,对一阶相似性产生的古典结果进行类比。
- 知识图谱中的类型约束表示学习
本文介绍了如何在现有的潜变量模型中整合先验类型约束来支持知识图谱的统计建模,并通过实验证明了关于关系类型的先验知识能够显著提高建模的性能,特别是在低复杂度约束下。同时,当在数据中缺少相关类型约束时,通过应用基于数据观察到的本地封闭世界假设, - 使用正则化深度神经网络挖掘视频分类中的特征和类别关系
本文介绍了一种利用深度神经网络与类别之间和特征之间的关系来改善视频分类性能的新型统一框架,并在两个公开数据集上展示出了超过七成的分类性能,同时作者们还公开了一个包含 91,223 段互联网视频的新测试集 FCVID 。
- ACL组合式分布式语义的多语言模型
通过基于多语种数据和联合嵌入的分布式假设扩展学习语义表示的新技术,学习出在跨语言上语义等价的句子之间高度对齐而在不相似的句子之间保持足够距离的表示。此方法不仅适用于单词层面,还可以对文档进行语义层面的表示学习。在两个跨语言文档分类任务上,我