- 降低集中度改善句子 BERT 语义空间
通过使用 Sentence-BERT 创建的嵌入表征语义空间的结构,我们发现其中普遍存在的高维度问题,即 hubness 会导致不对称的邻居关系,而减小 hubness 可以提供更好的文本语义表征。
- 内容增强图神经网络
本文中,我们提出了在高级 GNN 层次中通过内容生成的嵌入来增强节点嵌入,实验证明我们的模型具有高准确性和性能。
- 实现具有渐进学习的鲁棒文本检索
本文提出了一种用于强化文本检索的逐步学习嵌入模型 (PEG),通过增加负样本数量、提取难例负样本以及引入逐步学习机制,PEG 在检索真正的正例方面超过了现有的嵌入模型,在大语言模型的应用中具有重要潜力。
- 数据嵌入中的信号组合融合
本研究通过两种方法(基于相关性的融合检测和加法融合检测)揭示了嵌入式表达是多信号的融合,并在知识图推荐系统中发现与用户人口统计数据相关的信号。
- Sinhala-English 单词嵌入对齐:向低资源语言引入数据集和基准
利用可用的对齐技术,本研究试图对齐僧伽罗语和英语单词嵌入空间,并引入了僧伽罗语嵌入对齐的基准。此外,为了促进有监督的对齐,我们还引入了僧伽罗语 - 英语对齐数据集,作为我们针对词嵌入对齐的锚数据集。尽管与法语、德语或中文等高资源语言相比,我 - 一种语言及其维度:语言分形结构的内在维度
该研究介绍了一种新的研究对象 - 语言分形结构,假设一个自然语言的所有 n-gram 嵌入构成了该分形集合的代表样本,通过使用基于拓扑数据分析和数据图的最小生成树方法估计俄语和英语语言分形结构的固有维度,结果发现对于俄语和英语语言,所有的 - Banach-Tarski 嵌入与变换器
我们介绍了一种将任意递归数据结构嵌入到高维向量中的新构建方法,这些嵌入为变压器的潜在状态向量提供了可解释的模型。我们展示了当嵌入维度足够大时,这些嵌入可以解码为原始数据结构。这个解码算法在变压器中有一个自然的实现。我们还展示了这些嵌入向量可 - 图之道:基于多个领域对比学习的基础拓扑模型
使用对抗式对比学习提出了一种用于多个图领域的预训练模型,通过在拓扑结构上训练模型,并在评估时包含节点标签,我们展示了该模型在各种下游任务中与基准模型、未经训练的模型和非转移模型相比,性能相等或更好,包括在评估时使用节点标签,性能始终优于单个 - 通过简单的集成投影器进行去偏、校准和改进的半监督学习性能
该研究提出了一种名为 Ensemble Projectors Aided for Semi-supervised Learning (EPASS) 的简单方法,主要关注于改进学习的嵌入以提高现有对比联合训练半监督学习框架的性能。通过将多个投 - 让模型发表言论:通过嵌入进行多智能体辩论
通过引入名为 CIPHER 的通信机制,本文通过使用嵌入表示的期望而不是自然语言的方式,无需修改模型权重即可将更广泛的信息编码进大型语言模型之间的通信,实验证明 CIPHER 辩论方法在多项推理任务中取得了相对于传统推理方法 1-3.5% - 利用大型语言模型揭秘嵌入空间
利用大型语言模型将嵌入向量转化为可理解的叙述,解决了嵌入向量难于解释和使用的问题,增强了概念激活向量、通信新的嵌入实体和解码推荐系统用户偏好等任务的能力。
- 监督对比损失的神经坍缩几何工程
我们提出了一种修改对比损失函数来调整学习特征嵌入几何结构的方法,通过使用原型在每个批次中引导学习嵌入和原型的几何一致性,并在深度神经网络上基于基准视觉数据集进行了一系列实验证实。
- 大型语言模型中的上下文学习:基于神经科学的表示分析
大型语言模型通过背景学习在任务导向的例子中取得了显著的性能提升。本文研究了背景学习对语言模型嵌入和注意力表示的影响,以及这些变化如何对行为改进起到中介作用。通过神经科学启发的技术,我们发现在背景学习后,嵌入和注意力表示的变化与行为性能的改善 - 扩展解释:无监督且内在可解释的图嵌入
我们研究了图表示学习,并展示了可以学习和使用保留语义的数据增强来产生解释性,名为 INGENIOUS 的框架,它创造出固有的可解释性嵌入并消除了昂贵的事后分析所需。我们还引入了额外的度量衡解决了无监督表示学习解释性这一研究领域中缺乏形式化和 - 语义相似度预测优于其他语义相似度度量
使用经过微调的模型准确预测语义相似度,以测量自然语言文本之间的语义相似度,与传统的基于子序列重叠或嵌入的方法相比,效果更好。
- 大规模图上图神经网络的几何不稳定性
通过分析图神经网络(GNNs)产生的嵌入的几何不稳定性,我们提出了一种简单高效且图本地的图 Gram 指数(GGI),用于测量这种不稳定性,并研究 GNN 嵌入在大型图上的变化不稳定行为,以进行节点分类和链路预测。
- 一种基于周期随机梯度 MCMC 的概率自监督学习方法
使用循环随机梯度 Hamiltonian Monte Carlo (cSGHMC) 的贝叶斯自监督学习方法,在嵌入向量的高维多模态后验分布中探索,采用表达丰富的后验分布提供解释性和多样性的特征表示,从而提高了性能,在多种下游分类任务中实现了 - 类别与聚类不同:改进基于标签的降维算法评估
引入两个新的质量度量标准:标签可信度和标签连续性(Label-T&C),以改进基于类标签的降维评估过程。定量评估结果表明,Label-T&C 在评估降维嵌入如何保留聚类结构的准确度方面优于广泛使用的降维评估指标,并且具有可扩展性。此外,我们 - 实质还是风格:你的图像嵌入知道什么?
通过对多种视觉 embedding 进行系统转换任务的测试与比较,发现不同的网络预训练算法会在 embedding 中编码不同类型的图像非语义信息,并且这些信息可以被有效地利用到一些特定的下游应用中。
- 多相似性对比学习
基于多个相似性度量的新型多相似性对比损失(MSCon)提供了在不同相似关系下学习可推广嵌入的方法,通过自动学习对应相似性的对比权重,降低不确定任务的影响,从而在内部和外部领域中优于最先进的基准模型。