强健的组连通
该研究开发了一个名为 CLIPPINGS 的多模态框架,它利用端到端训练,对称视觉和语言双编码器,并通过对比语言 - 图像预训练来将它们对齐,以学习一个度量空间,在这个空间中,给定实例的汇总图像 - 文本表示对于同一类别的表示非常接近,对于不同类别的表示则很遥远。该框架在两个应用方面的表现都超过了广泛使用的字符串匹配方法,并且在不需要任何标签的情况下,仅基于图像 - OCR 对进行自我监督训练的纯自监督模型也比受欢迎的字符串匹配方法表现更好。
Apr, 2023
通过引入 GraLMatch 方法和使用 Transformer-based 模型(DistilBERT)来提高准确性,该论文探讨了多源实体匹配和实体组匹配的挑战,尤其是在存在记录更新和网络连接的情况下。
Jun, 2024
本文介绍了一个通用的实体链接系统,说明了如何将此系统适应域特定的实体,特别是那些内嵌在 COVID-19 相关科学文献中的实体。通过利用表格的结构和语义特征来提高整体实体链接性能,进一步推断科学表格的语义含义。
Jun, 2023
本研究提出一种基于强化学习的方法,将实体链接转换为序列决策问题,全局考虑前面提及的实体,并探索当前选择对后续决策的长期影响,实验证明该模型比现有系统表现更好且具有更好的泛化性能。
Feb, 2019
我们提出了一种新的树形目标函数 MINTREE,并引入了一种新的算法 Pair-Linking 来解决实体消歧的问题,实验证明,与现有的算法相比,我们的方法不仅更准确,而且速度惊人地快。
Feb, 2018
本研究提出了一种基于图的汇聚算法用于高维数据聚类,该算法通过研究图论中的两个基本概念(入度和出度)在聚类中的不同作用,定义了聚类的亲和度,该算法在图像聚类和物体匹配两个计算机视觉问题上均表现出优于最先进技术的效果。
Aug, 2012
本文提出了一种基于概率图模型的联合实体消岐方法,充分利用了文档级别实体共现和上下文信息,避免昂贵的训练过程和专业特征工程,通过节点置信传递来做近似推断,能够在实时场景中快速高效地工作,对多种基准数据集进行了准确性测试,表现与现有先进方法相当甚至更好。
Sep, 2015