实体对齐的冲突感知最优传输伪标记
本文提出了一种统一的伪标记框架,即 UPL-EA,以系统地对抗基于伪标记的实体对齐的确认偏差,该框架由基于最优输运和跨迭代伪标记校准两部分组成,分别设计用来消除识别虚假实体对齐的两种类型伪标记。实验表明,该方法能够在有限真实实体对齐种子的情况下取得竞争性的性能。
Jul, 2023
本研究提出了一种名为 SoTead 的无监督方法,用于提高实体对齐的性能,并解决不同知识图谱中的悬挂实体问题。该方法通过预先训练的词嵌入将实体对之间的转化成为最优传输问题,并引入虚拟实体对各 KG 中的悬挂实体进行对齐,最终实现一个半约束最优传输的实体对齐模型。在实验部分中,我们展示了 SoTead 在常用数据集上的优越表现,并证明其在其他基线模型中检测悬挂实体的能力。
Mar, 2022
本文提出了基于图的最优传输(GOT)框架,采用最优传输学习跨领域映射,通过表示实体和动态构建的图来解决节点和结构之间的匹配问题,并通过节点匹配和结构匹配的 Wasserstein 距离和 Gromov-Wasserstein 距离用于损失公式实现对齐,在包括图像 - 文本检索、视觉问答、图像描述、机器翻译和文本摘要等各种任务中取得了一致的高效表现。
Jun, 2020
无监督图对齐通过仅利用图结构和节点特征确定带属性图的一对一节点对应关系。我们提出一种名为 CombAlign 的模型框架,将计算节点表示并匹配近似嵌入的方法与确定最优传输的 Gromov-Wasserstein 学习相结合,通过特征转换、基于嵌入的启发式方法和优化权重匹配的约束,逐步优化节点对齐,实验证明在对齐准确性上较现有方法显著改进。
Jun, 2024
本文介绍了一种新的方法 OTMatch,通过使用最优输运损失函数,利用类别之间的语义关系,提高半监督学习的性能。与现有最先进的方法 FreeMatch 相比,在 CIFAR-10、STL-10 和 ImageNet 数据集上分别实现了 3.18%、3.46% 和 1.28% 的错误率降低,证明了我们方法在半监督学习中利用语义关系提升学习性能的有效性和优越性。
Oct, 2023
本研究提出了一种基于用于超平面空间上的点缀 Lorentz 测地空间的大旋量空间上的 gyrobarycenter 映射的正式主义,其衍生出对某些现有欧几里得变换方法到其双曲对应的 OT 的扩展,在检索方面 Euclidean 方法和 hyperbolic 方法具有类似的性能。
Dec, 2020
本论文提出了基于部分最优传输的联合分布对齐模型(POT),以降低不同领域之间的差异,提高跨域口语识别(SLID)系统的性能,并在 SLID 任务上进行了实验证明了 POT 模型显著提高了模型性能。
Mar, 2022
该研究提出了一个基于最优传输与聚类结构相结合的层级对齐方法,同时采用 ADMM 算法和 Sinkhorn 距离来提高噪声、模糊或多峰数据的对齐精度,并在合成数据和神经信号解码中进行了应用,表明该方法对于具有一致聚类结构的数据集在跨领域对齐方面具有显著的性能改进作用。
Jun, 2019
本文介绍了一种新的深度非平衡聚类问题,并提出了一种基于伪标签的学习框架,通过渐进式部分最优输运问题生成偏态感知的伪标签,并从高置信度样本中学习,实验证明了我们方法的优越性。
Jan, 2024
跨语言语义解析利用最优传输从高资源语言(例如英语)向训练数据稀缺的低资源语言转移解析能力。我们提出了一种新的跨语言语义解析方法,通过显式地最小化概率潜变量之间的跨语言差异来改善自然语言解析,减少训练样本的使用。我们在 MTOP 和 MultiATIS++SQL 两个数据集上评估方法,在少样本跨语言情景下取得了最先进的结果。消融研究进一步揭示了我们的方法即使没有平行输入翻译也能提高性能。此外,我们展示了我们的模型更好地在潜空间中捕获跨语言结构,从而提高了语义表示的相似性。
Jul, 2023