- 过程挖掘嵌入:学习 Petri 网的矢量表示
通过使用嵌入向量表示的 PetriNet2Vec 方法,我们展示了在过程挖掘增强中,PetriNet2Vec 从 Petri 网模型中学习结构和特性,以及在过程分类和过程检索中所展现的实用性。
- 特征选择作为深度顺序生成学习
我们提出了一种深度序列生成学习方法来进行特征选择,该方法通过学习连续嵌入空间,将特征选择决策序列映射为与效用分数相关的嵌入向量,从而解决了传统方法中存在的离散搜索空间和专家特定超参数的问题。
- Faiss 库
Faiss 是一个用于向量相似度搜索的工具库,它管理大型的嵌入向量集合,描述了向量搜索的权衡空间以及 Faiss 的设计原则和关键特性。
- 量子迁移学习的可接受性判断
该研究展示了使用从大型语言模型中提取的嵌入向量进行量子迁移学习算法在经典语言学任务(可接受性判断)上进行分类的潜在优势,包括性能和表达能力,评估结果显示出与最先进的经典迁移学习算法相媲美的量子迁移学习流程,为当前量子计算机在自然语言处理任务 - (几乎)什么都不分割:分割模型的通用提示对抗攻击
生成通用分割模型可以从各种提示(包括视觉和文本提示)中生成语义分割掩码,作者提出了一种生成与提示无关的对抗性攻击方法,通过在潜空间中最大化原始图像和扰动图像的编码之间的 L2 距离来扰乱各种提示下分割掩码。该攻击能在几乎无法察觉到的篡改下改 - MAAIG:运动分析与指导生成
提出了一种名为 MAAIG 的新的应用框架,可以为每个帧生成嵌入向量,以用户提供的运动动作视频为基础,然后将这些嵌入向量与每个帧的 3D 骨架相关联,并进一步输入预训练的 T5 模型,最终利用这些信息生成具体的运动指导,类似于专业教练的方式 - NEFTune: 噪声嵌入改善指令微调
使用简单的增强方法 NEFTune,对语言模型进行细调可以显著提高性能,在 AlpacaEval 测试中,LLaMA-2-7B 的标准细调结果为 29.79%,而使用带有噪声的嵌入向量增强后提高至 64.69%。NEFTune 还在现代指令 - causalimages:一个用于地球观测、生物医学和社会科学影像的因果推断的 R 包
使用 causalimages R 包,研究人员能够利用图像和图像序列数据进行因果推断,并提供了将卫星和生物医学图像等新数据源整合到因果关系研究中的新工具。该软件包提供了一系列功能,包括基于图像的因果推断分析、通过可解释的贝叶斯框架分解图像 - 有序和二进制说话人嵌入
本研究提出了一种有序二进制嵌入方法,通过嵌入向量中的维度排序并通过 Bernoulli 抽样将排序向量转换为二进制代码,从而实现说话者识别等任务中层次聚类,减少存储空间和加快检索速度。在 VoxCeleb 和 CN-Celeb 数据集上的实 - 基于摘要描述的文本检索
本文提出了新的检索模型,结合了指令模型和基于检索模型,使用大型语言模型的正负对进行训练,以改进当前文本嵌入技术性能。
- 使用自监督语音表示模型进行零样本文本转语音合成
本研究提出了一种零样本文本转语音模型,使用自监督学习获取的语音表示模型进行条件控制,并引入了声学特征和音素持续时间预测器的分离调制以提高重现性能和语音转换效果。
- TimeKit:基于时间序列预测的协同过滤升级工具
该研究提出了一个基于时间序列预测的升级工具包 (TimeKit),能够显著增强现有流行的协同过滤算法,通过每月提取用户 / 项目嵌入向量,并使用时间序列嵌入向量训练预测模型,然后根据嵌入向量的点积得分推荐。
- 基于图结构特征的转移概率矩阵嵌入
介绍了一种基于过渡概率矩阵的新方法,使用随机游走捕获节点和其周围节点的连接结构,并将信息转换为匿名游走以提取节点的拓扑特征,并在节点嵌入过程中使用匿名游走来获得更好的性能,在节点分类和链接预测任务中,该算法的性能优于现有文献中的最新算法,同 - 利用具体仿真技术通过交互检测新的物体类别
本文提出了一种用于 naive agent 检测与已知对象类型不同的新奇目标的方法,通过引入强化学习、卷积神经网络和嵌入向量等技术,可以实现从环境中提取相关信息判断物体是否属于新类别。
- 大型预训练语言模型向端到端语音识别器的知识转移
本文提出了一种方法,通过从大规模语言模型的嵌入向量获取语义知识来缓解需要耗费大量成本的转录训练的问题,并扩展了注意力机制的解码器和神经音响模式的解码器,以实现错误率的降低。
- ICLR对比自监督学习中的维度崩塌的理解
本文介绍了一种自监督学习方法 —— 对比学习。为了避免嵌入向量全部收敛到常数解的问题,这篇文章提出了一种新的对比学习方法 DirectCLR,该方法直接优化表示空间而不依赖于显式可训练的投影仪。实验表明,DirectCLR 在 ImageN - ACL上下文嵌入空间外流形正则化用于文本分类
本文提出了一种新的方法来找到和规范称为流形之外的剩余空间,利用两个从实际观察到的单词获得的嵌入,我们合成了流形之外的嵌入,训练鉴别器检测输入的嵌入是否位于流形之内,同时优化生成器。通过在各种文本分类基准上进行全面评估,证明了我们的方法的有效 - 序列推荐的稀疏兴趣网络
本文提出了一种名为 Sparse Interest Network(SINE)的方法,该方法使用 sparse-interest 模块自适应地为每个用户推断出一个稀疏的概念集,并相应地输出多个嵌入,以明确建模多个兴趣点用于下一个项目的推荐。
- AAAI深度度量学习的多层距离正则化
本文介绍了一种用于深度度量学习的新型基于距离的正则化方法,即多级距离正则化,可以使嵌入向量之间的成对距离受到多个级别的限制,并对训练过程进行了详细描述以及性能分析。
- Screen2Vec: GUI 界面与组件的语义嵌入
本文提出了 Screen2Vec 算法,该算法结合了 GUI 语义表示、嵌入向量和自监督的技术,在不需要手动注释的前提下,能够表示 GUI 屏幕和组件的所有特征,包括文字内容、视觉设计和布局模式、应用上下文,能够用于建模用户 - GUI 交