- 深呼吸:用哨兵标记增强大型语言模型的语言建模
我们提出了一种简单而有效的方法,通过将文本分割成多个块并在每个块的末尾插入特殊标记 <SR>,修改注意力掩码以将块的信息整合到相应的 <SR> 标记中,从而使 LLMs 能够从历史上的个别标记以及 <SR> 标记中解释信息,从而汇集块的语义 - 语义增强的关系度量学习在推荐系统中的应用
通过引入语义信息,我们提出了一种联合语义增强关系度量学习 (SERML) 框架,该框架从目标评论中提取语义信号,并通过该信号改进了原始基于关系的训练过程的区分能力,实验证明 SERML 在推荐系统中表现与几种先进方法相当。
- 将语义先验编码到隐式神经表示的权重中
本文提出了一种名为 SPW 的重新参数化方法,通过在 INR 模型的权重中编码语义先验,从而使 INR 模型隐含地包含语义信息并增强了其表征能力。实验证明,SPW 在多个任务上显著提高了各种 INR 模型的性能,包括图像拟合、CT 重建、M - 查询增强的适应性语义路径推理用于归纳式知识图谱补全
本文提出了 Query-Enhanced Adaptive Semantic Path Reasoning (QASPR) 框架,同时捕捉知识图谱的结构和语义信息,以增强归纳式知识图谱完成任务。QASPR 通过使用查询依赖的掩蔽模块自适应地 - 人类洞察与人工智能精确度的协调:共同推进知识图任务
通过人工智能与人类的合作,我们设计了一个名为 KG-HAIT 的系统,利用人类对知识图谱的洞察力来改进知识图谱嵌入模型,通过动态规划生成捕捉子图结构特征和语义相似性的人类洞察特征向量,并将其整合到知识图谱嵌入模型的训练中,取得了显著的性能提 - TrafficGPT:面向多尺度空间 - 时间代理框架的交通分析与生成
利用 AI 代理、多尺度交通数据、语义信息以及可视化,设计了 TrafficGPT 系统,实现多尺度交通预测和交互性能,通过实验验证其在真实道路数据集上的卓越表现。
- 轻量级全局推理视网膜层分割
本文提出了一种轻量级网络,用于光学相干断层扫描图像的视网膜层分割,并通过多尺度特征提取和变换块对特征图的语义信息进行全面利用和全局推理能力的提升,并通过多尺度不对称注意(MAA)模块在每个编码器尺度上保留语义信息,实现了比当前最先进的 Tr - 多模态提示学习的盲目图像质量评估
该文章介绍了一种基于多模式提示的创新图像质量评估方法,通过精心设计的提示,从视觉和语言数据中挖掘增量语义信息,在不同数据集上展现出竞争性能,达到了鲁棒性和准确性的提升。
- 错失的联系:大型语言模型的横向思维谜题
通过研究自动化 AI 系统在 Connections 谜题中的效果,该研究探讨了该游戏作为抽象推理的自动化基准测试和衡量数据驱动语言系统中编码的语义信息的潜力。研究发现 Connections 谜题具有挑战性和可行性,是未来工作的重要测试平 - 基于语义的人形机器视觉任务的主动感知技术与视点焦点传感器
通过使用语义信息,可以在场景探索和视觉搜索任务中有效地完成视觉任务,从而证明了语义模型在视觉任务中的优越性。
- 基于对象和分割的语义特征在基于深度学习的室内场景分类中的应用
利用深度学习方法和语义信息,本文提出了一种新颖的室内场景分类方法,通过目标检测和语义分割技术获取语义信息,进一步提取基于 Hu 矩的分割类别形状特征,并使用全局特征、目标特征和语义分割特征构建了一个三分支网络,即 GOS2F2App。在 S - CVPR基于渐进语义引导的视觉变形器用于零样本学习
我们提出了一种用于零样本学习的渐进式语义引导视觉 Transformer(ZSLViT),通过语义嵌入令牌学习改进视觉 - 语义对应关系,发现语义相关的视觉令牌,并且通过弱语义 - 视觉对应关系融合来舍弃与语义无关的视觉信息,从而在零样本学 - 通过融合 MOOC 学习场景中的视频语义进行多模态情感识别
探索视频语义信息对学习者情绪的影响,本文提出一种融合视频语义信息和生理信号的多模态情绪识别方法,实现了情绪识别性能的显著提升,为 MOOC 学习情景的情绪识别研究提供了新的视角和高效的方法。
- AAAI基于弱监督的深度超球面量化图像检索
通过利用弱标记图像和词嵌入技术,本研究提出了一种基于深度量化的弱监督超球面量化方法,能够有效地生成紧凑编码,并实现图像检索任务中的高性能表现。
- ReFT: 语言模型的表示微调
参数高效微调方法通过少量权重的调整来适应大模型。本研究通过发展一系列表示微调方法来探索该假设,利用隐藏表示上的任务特定干预进行表示编辑,展示在多个评估中,低秩线性子空间表示微调方法可以实现比先前最先进参数高效微调方法更好的效率和性能平衡。
- SemGrasp: 通过语言对齐离散化生成语义抓取
本文提出了一种基于语义的抓取生成方法 SemGrasp,并且介绍了一个将目标、抓取和语言整合到一个统一的语义空间中的多模态大型语言模型 (Multimodal Large Language Model, MLLM)。实验结果表明,SemGr - 三维形态一致化:野外三维感知图像对齐
我们提出了 3D Congealing 方法,这是一个新颖的问题,即对于捕捉到语义相似物体的 2D 图像进行 3D 感知对齐。我们的目标是将输入图像中的共享语义部分与 2D 图像中的知识聚合到共享的 3D 规范空间中,通过一个不依赖于形状模 - AE SemRL:用自编码器学习语义关联规则
基于自动编码器的方法可以从时间序列数据中学习和提取关联规则,同时利用语义信息可以促进学习可推广和可解释的关联规则。实验证明,从自动编码器创建的潜在表示中可以提取语义关联规则,并且在许多情况下,该方法的执行时间比现有技术的关联规则挖掘方法快几 - BERT 模型中的注意力分数对 GLUE 基准上的句法和语义任务中的词类意识研究
本研究通过对 BERT 模型进行细调过程中,考察词汇类别对注意力分数的影响,进一步验证了重点语义信息的下游任务中注意力分数主要集中在内容词上的假设,并揭示了 BERT 层对特定词汇类别具有一致偏好的存在。
- Exosense:适用于安全外骨骼导航的视觉中心场景理解系统
通过视觉为核心的场景理解系统,本论文提出了 Exosense,它能够生成丰富的全局一致性高程图,包括语义和地形可通过性信息,并展示了其对于周期性步行步态的挑战的鲁棒性以及在室内环境中构建准确的语义丰富地图的能力,同时展示了其在运动规划方面的